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PRÓLOGO 


Este libro es una continuación de mi Calculus, volumen I, segunda edición. 
El presente volumen fue escrito con el mismo plan fundamental que inspiró al 
primero. Un adecuado enfoque hacia la técnica se combina con un riguroso 
desarrollo teórico. Se ha procurado hacer llegar al estudiante el espíritu de la 
matemática moderna sin exagerar el formalismo. Como en el volumen I, se han 
incluido comentarios de tipo histórico para hacer vivir al lector la evolución de 
las ideas. 

El segundo volumen está dividido en tres partes, tituladasr Análisis lineal, 
Análisis no lineal, y Temas especiales. Los dos últimos capítulos del volumen I 
han sido repetidos y son los dos primeros capítulos del volumen II, de modo que 
toda la materia relativa al álgebra lineal está completa en cada volumen. 

La parte 1 contiene una introducción al álgebra lineal, incluyendo transfor- 
maciones lineales, matrices, determinantes, autovalores y formas cuadráticas. 
Se dan aplicaciones al análisis, en particular al estudio de las ecuaciones diferen- 
ciales lineales. Se estudian los sistemas de ecuaciones diferenciales con la ayuda 
del cálculo matricial. Se demuestran los teoremas de existencia y unicidad por 
medio del método de Picard de aproximaciones sucesivas, que también se trata 
utilizando los operadores de contracción. 

En la parte 2 se discute el cálculo de funciones de varias variables. El cálculo 
diferencial se unifica y simplifica con la ayuda del álgebra lineal. Se incluyen 
reglas de la cadena para campos escalares y vectoriales, y aplicaciônes a las 
ecuaciones diferenciales en derivadas parciales y a problemas de extremos. En 
cálculo integral se incluyen integrales de línea, integrales múltiples y de superficie, 
con aplicaciones al análisis vectorial. En esto la exposición sigue más o menos la 
línea clásica y no incluye un desarrollo formal de las formas diferenciales. 

Los temas especiales tratados en la parte 3 son Probabilidades y Análisis 
numérico. El de probabilidades está dividido en dos capítulos, uno que trata de 
los espacios muestrales finitos o infinitos numerables; el otro de espacios mues- 
trales no numerables, variables aleatorias, y funciones de distribución. Las apli- 
caciones se ilustran en el estudio de variables aleatorias uni- y bi-dimensionales. 

El último capítulo contiene una introducción al análisis numérico, poniendo 
especial atención en los distintos tipos de polinomios de aproximación. Termina 
el libro con un estudio de las fórmulas de integración aproximada, tales como la 
regla de Simpson y una discusión de la fórmula de sumación de Euler. 


VII 



VIII 


Prólogo 


En este volumen hay materia suficiente para un curso anual completo con 
tres o cuatro sesiones semanales. Presupone un conocimiento del cálculo con una 
variable como se desarrolla en la mayoría de los cursos del primer ano de cálculo. 
El autor ha imaginado el curso con cuatro sesiones semanales, dos de exposición 
por parte del profesor y dos para preguntar a los alumnos, empleando aproxima- 
damente diez semanas en cada parte y omitiendo las secciones sehaladas con 
asterisco. 

Este segundo volumen ha sido planeado de modo que muchos capítulos 
pueden omitirse en cursos abreviados. Por ejemplo, el último capítulo de cada 
parte puede suprimirse sin romper la continuidad de la exposición. La parte 
primera proporciona material para un curso combinado de álgebra lineal y de 
ecuaciones diferenciales ordinarias. Cada profesor puede elegir los temas adecua- 
dos a sus necesidades y preferencias consultando el diagrama de la página si- 
guiente que muestra la interdependencia lógica de los capítulos. 

Una vez más reconozco con agrado el asesoramiento de numerosos amigos y 
colegas. Al preparar la segunda edición recibí valiosa ayuda de los profesores 
Herbert S. Zucherman de la Universidad de Washington, y Basil Gordon de la 
Universidad de California, Los Ángeles, cada uno de los cuales sugirió varias 
mejoras. Agradezco también al personal de la Blaisdell Publishing Company su 
cooperación y ayuda. 

Como en otras ocasiones me da especial satisfacción expresar mi gratitud 
a mi esposa por su valiosa y variada contribución. En reconocimiento le dedico 
gustosamente este libro. 


Pasadena, California 


T. M. A. 
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ESPACIOS LINEALES 


1.1 Introducción 

A lo largo de la Matemática se encuentran muchos ejemplos de objetos mate- 
máticos que pueden sumarse unos con otros y multiplicarse por números reales. 
Ante todo, los números reales son objetos de tal natuialeza. Otros ejemplos son 
las funciones vectoriales, los números complejos, las series y los vectores en el 
espacio n-dimensional. En este capítulo tratamos un concepto matemático general, 
llamado espacio lineal, que incluye todos esos ejemplos y muchos otros como 
casos particulares. 

Brevemente, un espacio lineal es un conjunto de elementos de naturaleza 
cualquiera sobre el que pueden realizarse ciertas operaciones llamadas adición y 
multiplicación por números. A1 definir un espacio lineal no especificamos la 
naturaleza de los elementos ni decimos cómo se realizan las operaciones entre 
ellos. En cambio, exigimos que las operaciones tengan ciertas propiedades que 
tomamos como axiomas de un espacio lineal. Vamos ahora a hacer con detalle una 
descripción de esos axiomas. 


1.2 Definición de espacio lineal 

Sea V un conjunto no vacío de objetos, llamados elementos. E1 conjunto V 
se llama espacio lineal si satisface los diez axiomas siguientes que se enuncian 
en tres grupos. 

Axiomas de clausura 

axioma 1. clausura respecto de la adición. A todo par de elementos 
x e y de V corresponde un elemento único de V llamado suma de x e y, designado 
por x + y. 
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AXIOMA 2. CLAUSURA RESPECTO DE LA MULTIPLICACIÓN POR NÚMEROS REA- 
les. A todo x de V y todo número real a corresponde un elemento de V llamado 
producto de a por x, designado por ax. 

Axiomas para la adición 

axioma 3. ley conmutativa. Para todo X y todo y de V, tenemos 
x + y = y + X . 

axioma 4. ley asociativa. Cualesquiera que sean x, y, z de V, tenemos 
(x + y) + z = x + (y -f z). 

axioma 5. existencia de elemento cero. Existe un elemento en V, de- 
signado con el símbolo O, tal que 

x + O = x para toao x de V: 

axioma 6. existencia de opuestos. Para todo x de V, el elemento ( — 1)* 
tiene la propiedad 

x + (-l)x = 0 . 

Axiomas para la multiplicación por números 

axioma 7. ley asociativa. Para todo x de V y todo par de números 
reales a y b, tenemos 


a(bx) = (ab)x . 

AXIOMA 8. LEY DISTRIBUTIVA PARA LA ADICIÓN EN V. Para todo X y todo 
y de V y todo número real a, tenemos 

a(x + y) = ax + ay. 

AXIOMA 9. LEY DISTRIBUTIVA PARA LA ADICIÓN DE NÚMEROS. Para todo 
x de V y todo par de números reales a y b, tenemos 

(a + b)x = ax + bx . 

axioma 10. existencia de elemento idéntico. Para todo x de V, tene- 
mos \x = x. 
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Los espacios lineales así defmidos, se llaman, a veces, espacios lineales reales 
para resaltar el hecho de que se multiplican los elementos de V por números 
reales. Si en los axiomas 2, 7, 8 y 9 se reemplaza número real por número com- 
plejo, la estructura que resulta se llama espacio lineal complejo. Algunas veces 
un espacio lineal se llama también espacio vectorial lineal o simplemente espacio 
vectorial; los números utilizados como multiplicadores se llaman escalares. Un 
espacio lineal real tiene números reales como escalares; un espacio lineal com- 
plejo tiene como escalares números complejos. Si bien consideraremos principal- 
mente ejemplos de espacios lineales reales, todos los teoremas son válidos para 
espacios lineales complejos. Cuando digamos espacio lineal sin más, se sobrenten- 
derá que el espacio puede ser real o complejo. 


1.3 Ejemplos de espacios lineales 

Si precisamos el conjunto V y decimos cómo se suman sus elementos y cómo 
se multiplican por números, obtenemos un ejemplo concreto de espacio lineal. 
E1 lector fácilmente puede comprobar que cada uno de los ejemplos siguientes 
satisface todos los axiomas para un espacio lineal real. 

ejemplo 1. Sea V = R, el conjunto de todos los números reales, y sean 
x + y y ax la adición y la multiplicación ordinarias de números reales. 

EfEMPLO 2. Sea V = C el conjunto de todos los números complejos, defì- 
nimos x + y como la adición ordinaria de números complejos, y ax como la mul- 
tiplicación del número complejo x por el número real a. Aunque los elementos de 
V sean números complejos, éste es un espacio lineal real porque los escalares 
son reales. 

ejemplo 3. Sea V = V„, el espacio vectorial de todas las n-plas de núme- 
ros reales, con la adición y la multiplicación por escalares defìnidas en la forma 
ordinaria en función de los componentes. 

ejemplo 4. Sea V el conjunto de todos lo^vectores V„ ortogonales a un 
vector no nulo dado N. Si n = 2, este espacio lineal es una recta que pasa por O 

con N como vector normal. Si n = 3, es un plano que pasa por Ò con N como 

vector normal. 

Los siguientes ejemplos se llaman espacios funcionales. Los elementos de V 

son funciones vectoriales, con la suma de dos funciones / y g defìnidas en la 

forma ordinaria: 


(f+g)(x)=A*)+gW 
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para todo real x en la intersección de los dominios de / y g. La multiplicación de 
una función / por un escalar real a se defíne así: af es aquella función cuyo valor 
en cada x del dominio de / es af(x). E1 elemento cero es la función cuyos valores 
son nulos para todo x. E1 lector puede comprobar fácilmente que cada uno de 
los conjuntos siguientes es un espacio funcional. 

ejemplo 5. E1 conjunto de todas las funciones definidas en un intervalo 
dado. 

ejemplo 6. E1 conjunto de todos los polinomios. 

ejemplo 7. E1 conjunto de todos los polinomios de grado < n, siendo n 
fijo. (Siempre que consideremos este conjunto, se sobrentenderá que siempre está 
incluido el polinomio nulo.) E1 conjunto de todos los polinomios de grado igual 
a n no es una espacio lineal porque no se satisfacen los axiomas de clausura. Por 
ejemplo, la suma de dos polinomios de grado n puede no ser de grado n. 

ejemplo 8. E1 conjunto de todas las funciones continuas en un intervalo 
dado. Si el intervalo es [a, 6], designamos este espacio con C(a,b). 

ejemplo 9. E1 conjunto de todas las funciones derivables en un punto dado. 

ejemplo 10. E1 conjunto de todas las funclones integrables en un intervalo 
dado. 

ejemplo 11. E1 conjunto de todas las funciones / definidas en el punto 1 
siendo /(1) = 0. E1 número 0 es esencial en este ejemplo. Si reemplazamos 0 por 
un número no nulo c, violamos el axioma de clausura. 

ejemplo 12. E1 conjunto de todas las soluciones de una ecuación diferencial 
lineal homogénea y" + a/ + by = 0, donde a y b son constantes dadas. También 
aquí es esencial el 0. E1 conjunto de soluciones de una ecuación diferencial no 
homogénea no satisface los axiomas de clausura. 

Estos ejemplos y muchos otros hacen patente cómo el concepto de espacio 
lineal está extendido por el Álgebra, la Geometría y el Análisis. Cuando se deduce 
un teorema de los axiomas de un espacio lineal, obtenemos un resultado válido 
para cada ejemplo concreto. Unificando varios ejemplos de este modo, consegui- 
mos un conocimiento más profundo en cada uno. En ocasiones el conocimiento 
de un determinado ejemplo ayuda para anticipar o interpretar resultados válidos 
para otros ejemplos y pone en evidencia relaciones que de otro modo podrían 
paslar inadvertidas. 
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1.4 Consecuencias elementales de los axiomas 

Los teoremas que siguen se deducen fácilmente de los axiomas de un espacio 
lineal. 

teorema 1.1. unicidad del elemento cero. En cualquier espacio lineal 
existe un elemento cero y sólo uno. 

Demostración. E1 axioma 5 nos asegura que existe por lo menos un elemento 
cero. Supongamos que existan dos, sean O, yí) 2 . Haciendo x = Oj y O = 0 2 en 
el axioma 5, obtenemos O t + 0 2 = O,. Análogamente, haciendo x = 0 2 y 
O = Oi, encontramos 0 2 + O, = 0 2 . Pero Oj + 0 2 = 0 2 + Oj por la ley con- 
mutativa, así que O, = 0 2 . 

teorema 1.2. unicidad de elementos opuestos. En cualquier espacio 
lineal todo elemento tiene exactamente un opuesto. Esto es, para todo x existe 
un y, y sólo uno tal que x + y = O. 

Demostración. E1 axioma 6 nos dice que cada x tiene por lo menos un 
opuesto, a saber ( — l)x. Supongamos que x tenga dos opuestos, sean e y 2 . En- 
tonces x + y t = O y x + y 2 = O. Sumando y 2 a los dos miembros de la primera 
igualdad y aplicando los axiomas 5, 4 y 3, obtenemos que 

/2 + (x + yò == y 2 + O = y 2 , 

y 

+ (x + yò = (j2 + x) + yt - O + y t = j! + O = y x . 

Por consiguiente y, = y 2 , con lo que x tiene exactamente un opuesto, el elemen- 
to (— 1 )x. 

Notación. E1 opuesto de x se designa por —x. La diferencia y — x se define 
como la suma y + (— x). 

E1 teorema siguiente muestra un conjunto de propiedades que rigen los 
cálculos algebraicos elementales en un espacio lineal. 

teorema 1.3. En un espacio lineal, designemos con x e y dos dementos 
cualesquiera y con a y b dos escaiares cualesquie'^. Tenemos entonces las pro- 
piedades siguientes: 

a) Ox = O. 

b) aO = O. 
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c) { - a)x = - (ax) - a( - x). 

d) Si ax = O, entoncesa = 0 o x = O, o los dos. 

e) Si ax = ay y a¥= 0 entonces x = y. 

f) Si ax = bx y x ¥ O, entonces a = b. 

g) - (x + y) = ( - x) + ( - y) = - x - y. 

h) x + x = 2x, x+ x +x = 3x, y en general, 1 * = nx. 

Demostraremos a), b) y c) y dejamos como ejercicios las demostraciones de las 
otras propiedades. 

Demostración de a). Sea z = Ox. Deseamos demostrar que z = O. Su- 
mando z a sí mismo y aplicando el axioma 9, encontramos que 

z + z = Ox + Ox = (0 + 0)x = Ox = z . 


Sumemos ahora — z a ambos miembros y obtenemos z = O. 

Demostración de b). Sea z = aO, sumar z a sí mísmo, y aplicar el axioma 8. 

Demostración de c). Sea z = (—a)x. Sumando z a ax y aplicando el axio- 
ma 9, encontramos que 

z + ax = (—a)x + ax = (-a + a)x = Ox = O, 

así que z es el opuesto de ax, z = —(ax). Análogamente, si sumamos a(—x) a 
ax y aplicamos el axioma 8 y la propiedad b), encontramos que a(—x) = —(ax). 

1.5 Ejercicios 

En los ejercicios del 1 al 28, determinar si cada uno de los conjuntos dados es un 
espacio lineal real, si la adición y multiplicación por escalares reales está definida en 
la forma usual. Para aquellos en los que no es así, decir cuáles son los axiomas que no se 
cumplen. Las funciones de los ejercicios 1 al 17 son reales. En los ejercicios 3, 4 y 5, cada 
función tiene un dominio que contiene 0 y 1. En los ejercicios 7 al 12, cada dominio con- 
tiene todos Ios números reales. 

1. Todas las funciones racionales. 

2. Todas las funciones racionales f/g, con el grado de / < que el grado de g (incluyen- 
do f = 0). 

3. Todas las / con /(0) = /(1). 

4. Todas las / con 2/(0) =/'(1). 

5. Todas las / con /(í) = 1 + /(0). 

6. Todas las funciones escalonadas definidas en [0, 1]. 

7. Todas las / en las que f(x) 0 cuando x —> + oo. 

8. Todas las funciones pares. 

9. Todas las funciones impares. 
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10 . 

11 . 

12 . 

13. 

14. 

15. 

16. 

17. 

18. 

19. 

20 . 
21 . 
22 . 

23. 

24. 

25. 

26. 
27. 


28. 

29. 


32. 


Todas las funciones acotadas. 

Todas las funciones crecientes. 

Todas las funciones con período 2 ir. 

Todas las / integrables en [0,1] con JJ f(x)dx — 0. 

Todas las / integrables en [0,1] con í% f(x)dx > 0. 

Todas las / que satisfacen f(x) = /(1 — x) para todo x. 

Todos los polinomios de Taylor de grado <; n para un n fijo (incluyendo el polino- 
mio cero). 

Todas las soluciones de una ecuación diferencial lineal homogénea de segundo orden 
y" + P(x)y’ + Q(x)y = 0, siendo P y Q funciones dadas, continuas para todo x. 

Todas las sucesiones reales acotadas. 

Todas las sucesiones reales convergentes. 

Todas las series reales convergentes. 

Todas las series reales absolutamente convergentes. 

Todos los vectores (x, y, z) de V„ con z = 0. 

Todos los vectores (x,y, z) de V„ con x = 0 o y = 0. 

Todos los vectores (x, y, z) de V', con y = 5x. 

Todos los vectores (x,y,z) de V 3 con 3* + 4y = 1, z = 0. 

Todos los vectores (x,y,z) de V, que son productos de (1, 2, 3) por escalares. 

Todos los vectores (x, y, z) de V 3 cuyos componentes satisfacen un sistema de tres ecua- 

ciones lineales de la forma 


a n x + a 12 y + a 13 z = 0 , a 21 x + a^y + a^z = 0 , a al x + a a2 y + a^z = 0 . 


Todos los vectores de V„ que son combinaciones lineales de dos vectores dados A y B. 
Sea V = R + , el conjunto de los números reales positivos. Defìnamos la «suma» de dos 
elementos * e y de V como su producto x --y (en el sentido ordinario), y definamos la 
«multiplicación» de un elemento x de V por un escalar c poniendo x°. Demostrar que 
V es un espacio lineal real con el elemento cero. 

a) Demostrar que el axioma 10 puede deducirse de los otros axiomas. 

b) Demostrar que el axioma 10 no puede deducirse de los otros axiomas si el axioma 
6 es reemplazado por el axioma 6': Para todo x de -V y todo y de V tenemos que 
x+y=0. 


Sea S el conjunto de todos los pares ordenados (x, ,x 9 ) de números reales. En cada casc 
determinar si S es o no un espacio lineal con las operaciones de adición y multiplica- 
ción por escalares definidas como se indica. Si el conjunto no es un espacio lineal, 
indicar cuáles son los axiomas que no se cumplen. 

a) (*!, x 2 ) + (y x , y 2 ) = (x x +y lt x 2 + y 2 ), a(x t , x 2 ) = (ax x , 0). 

b) (*!, x 2 ) + (y % , y 2 ) = (Xi + y r , 0), a(*i , x 2 ) = (a Xl , ax 2 ). 

c) (*!, x 2 ) + (+!, y 2 ) = ( Xl , x 2 + y^, a( Xl , x 2 ) = (a Xl , ax 2 ). 

d) ( Xl , x 2 ) + (+!, y 2 ) = (|x, + x 2 \, \y L + y 2 1), a( Xl , x 2 ) = (laxil, \ax 2 \). 

Demostrar las partes de la d) a la h) del teorema 1|,3. 


1.6 Subespacios de un espacio lineal 

Dado un espacio lineal V sea S un subconjunto no vacío de V. Si S es tam- 
bién un espacio lineal, entonces S se llama subespacìo de V. E1 teorema que sigue 
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da un sencillo criterio para determinar si un subconjunto de un espacio lineal 
es o no un subespacio. 

teorema 1.4. Sea S un subconjunto no vacío de un espacio lineal V. 
Tal subconjunto S es un subespacio si y sólo si satisface los axiomas de clausura. 

Demostración. Si S es un subespacio, satisface todos los axiomas de un 
espacio lineal, y por tanto, en particular, los axiomas de clausura. 

Demostremos ahora que si S satisface los axiomas de clausura, satisface 
también los otros. Las leyes conmutativa y asociadva para la adición (axiomas 
3 y 4) y los axiomas para la multiplicación por escalares (axiomas del 7 al 10) 
se satisfacen automáticamente en S porque son válidos para todos los elementos 
de V. Falta comprobar los axiomas 5 y 6, la existencia del elemento cero en S, 
y la existencia de un opuesto para cada elemento de S. 

Sea x un elemento cualquiera de S. (S tiene por lo menos un elemento ya que 
no es vacío.) Según el axioma 2, ax está en S para todo escalar a. Tomando a = 0, 
resulta que Ox está en S. Pero Ox = O, en virtud del teorema 1.3 a), con lo 

cual O e S, y se satisface el axioma 5. Tomando a = — 1, vemos que ( —l)x 

está en S. Pero x + (—1)* = 0 ya que x y ( — 1)* están ambos en V, así que el 

axioma 6 se satisface en S. Por consiguiente S es un subespacio de V. 

definición. Sea S un subconjunto no vacío de un espacio lineal V. Un 
elemento x de V de la forma 

X =2 c i x i< 

en donde x u ..., xn pertenecen todos a S y c lt ..., c* son escalares, se denomina 
combinación lineal de elementos de S. El conjuntO'de todas las combinaciones 
lineales finitas de elementos de S satisface los axiomas de clausura y por tanto 
es un subespacio de V. Decimos de ese subespacio que está generado por S, o 
también le llamamos la envolvente lineal de S, y lo designamos por L(S). Si S 
es vacío, definimos L(S) como {O}, el conjunto consta sólo del elemento cero. 

Conjuntos distintos pueden generar el mismo subespacio. Por ejemplo, el es- 
pacio V 2 está generado por cada uno de los siguientes conjuntos de vectores: 
{i,jh {*» j> i + j), {O, i, —i,j, —j, i + y}.El espacio de todos los polinomios n p(t) 
de grado ^n está generado por el conjunto de n + 1 polinomios { 1 , t, f, .. ., f"}. 

' También está generado por el conjunto {1, t/2, f 2 /3,.. ., t"/(n + 1)} y por 
{1,(1 + í), (1 + í) 2 ,. .., (1 + f)"}. E1 espacio de todos los polinomios está ge- 
nerado por el conjunto infmito de los polinomios {1, t, t 2 ,... }. 

A1 llegar aquí surgen de modo natural numerosas preguntas. Por ejemplo, 
Z,qué espacios pueden generarse por un número fìnito de elementos? Si un espacio 
está generado por un número fìnito de elementos, ^cuál es el menor número de 
elementos necesarios? Para discutir estas cuestiones y otras con ellas relacionadas 
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introduciraos los conceptos de dependencia, independencia, bases y dimensión. 
Y'a en el volumen I encontramos esas ideas al estudiar el espacio vectorial V„ 
Ahora vamos a extenderlas a espacios lineales de tipo general. 


1.7 Conjuntos dependientes e independientes en un espacio lineal 

definición. Un conjunto S de elementos de un espacio lineal V se llama 
dependiente si existe un conjunto finito de elementos distintos de S, x ly .... Xk, 
y un correspondiente conjunto de escalares c lt .... Ck, no todos cero, tales que 

ï CiX i = °. ' 

El conjunto S se llama independiente si no es dependiente. En tal caso, cuales- 
quiera que sean los elementos distintos x u .... Xk de S y los escalares c u .... Ck, 

2 c ( x { = 0 implica c k = c t = ■ ■ • = c k = 0. 

Si bien la dependencia y la independencia son propiedades de los conjuntos 
de elementos, podemos también aplicar esas denominaciones a los elementos 
mismos. Por ejemplo, los elementos de un conjunto independiente se llaman ele- 
mentos independientes. 

Si S es un conjunto finito, la definición anterior está de acuerdo con la dada 
en el Volumen I para el espacio V». No obstante, la definición dada aquí no está 
restringida a conjuntos finitos. 

ejemplo 1. Si un subconjunto T de un conjunto S es dependiente, el mismo 
S es dependiente. Esto es lógicamente equivalente a la afirmación de que todo 
subconjunto de un conjunto independiente es independiente. 

ejemplo 2. Si un elemento de S es el producto de otro por un escalar, S 
es dependiente. 

fiemplo 3. Si O e S. entonces S es dependiente 

ejemplo 4. E1 conjunto vacío es independiente . 

En el Volumen I fueron discutidos muchos ejemplos de conjuntos dependien- 
tes e independientes. Los ejemplos que a continuación se comentan, ilustran esos 
conceptos en espacios funcionales. En cada caso el espacio lineal fundamental V 
es el conjunto de todas las funciones reales definidas en la recta real. 
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ejemplo 5. Sean «,(<) = cos 2 t, u 2 (t) = sen 2 1, u 3 (t) = 1 para todo núme- 
ro real t. La identidad pitagórica prueba que «, + u 2 — u 3 = O, así que las tres 
funciones «,, « 2 , u 3 son dependientes. 

ejemplo 6. Sea uu(t) = t k para k = 0, 1, 2, ..., y t real. E1 conjunto 
S = {«„, «,, « 2 , .. . } es independiente. Para demostrar esto, basta demostrar que 
para cada n los n + 1 polinomios «„, «,, ..., u„ son independientes. Una rela- 
ción de la forma c k u k = O significa que 


( 1 . 1 ) 


2^ = o 


para todo real t. Cuando t = 0, encontramos que c 0 = 0. Repitiendo el proceso, 
encontramos que cada coeficiente Ck es cero. 

ejemplo 7. Si fl,, ..., a„ son números reales distintos, las n funciones 
exponenciales 

«iW = e tt ' x ,..., u„(.x) = e a * x 

son independientes. Podemos demostrar esto por inducción sobre n. E1 resultado 
es trivial cuando n = 1. Por consiguiente, supongamos que es válida para n — 1 
funciones exponenciales y consideremos los escalares c,, ..., c„ tales que 

(1-2) ÌV** = o. 

Sea a M el mayor de los n números fl„ ..., a». Multiplicando ambos miembros de 

(1.2) por e~ a ^, obtenemos 

(1.3) f Ck e la >- a * '* = 0. 


Si k M, el número a* — a M es negativo. Por consiguiente, cuando x -*■ + en 
la ecuación (1.3), cada término con k=£M tiende a cero y encontramos que cm = 0. 
Suprimiendo el término M-ésimo de (1.2) y aplicando la hipótesis de inducción, 
encontramos que cada uno de los n — 1 restantes coeficientes Ck es cero. 

teorema 1.5. Sea S={xí ,..., x k } un conjunto independiente que consta 
de k elementos de un espacio lineal V y sea L(S) el subespacio generado por S. 
Entonces todo conjunto de k +1 elementos do T.tS) es dependiente. 
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Demostración. La demostración es por inducción sobre k, número de ele- 
mentos de S. Supongamos primero que k= 1. Entonces, por hipótesis, S contiene 
un solo elemento x, siendo x r ¥= O puesto que S es independiente. Ahora tome- 
mos en L(S) dos elementos distintos y 2 e y 2 . Entonces, cada uno de estos elementos 
es un escalar multiplicado por x u sea y, =c,x, e y 2 =c?Xi, en donde c, y c 2 no 
son ambos cero. Multiplicando yi por c 2 e y 2 por c, y restando, obtenemos 


^yi -0^ = 0. 


Por lo tanto y r e y 2 son dependientes, quedando así demostrado el teorema 
cuando k~ 1. 

Supongamos ahora que el teorema es cierto para k~ 1 y demostremos que 
también lo es para k. Tomemos un conjunto de 1 elementos en L(S), sea 
T = {y!, y* ....., yjt + i}. Queremos probar que T es dependiente. Puesto que cada 
elemento yj está contenido en L(S), podemos escribir 

(1.4) y,'=5>ii*i 

para cada i= 1,2,,..., k+ 1. Examinemos todos los escalares a^ que multipli- 
can a Xi y, para ello, consideremos dos casos en la demostración. 

CASO 1. a;i = 0 para todo i= 1,2,..., k+ 1. En este caso la suma (1.4) 
no incluye a x u así cada y,- en T está en la envolvente lineal del conjunto 
S'={x 2 ,..., x*}. Pero S' es independiente y contiene k— 1 elementos. Por induc- 
ción y para k— 1, el teorema es cierto, siendo por lo tanto, T dependiente. Esto 
demuestra el Caso 1. 

CASO 2. No son cero todos los escalares an. Suponemos que a rl =+ 0. 
Tomando i= 1 en la ecuación (1.4) y multiplicando los dos miembros por d, 
siendo Ci=an/a llt obtenemos: 


c<yi = +ïc,a li x i . 


Si de esta ecuación restamos la (1.4), resulta: 


c.+i - y,- =’lic i a lj - a i} )x } . 


para i=2,..., k+ 1. Esta ecuación expresa cada uno de los elementos c,yi—y ; 
como una combinación lineal de los k—1 elementos independientes x 2 ,. . ., x*. 
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Por inducción.los k elementos Ciy^—yt deben ser dependientes. En consecuencia, 
para cualquier elección de escalares t 2 ,, 4 + 1 , no todos cero, tenemos 

2 ui^yi - yì> = 0 ’ 

y de aquí deducimos k+i 

(? 1 r<C< ) y i ~S iYi = °' 

Esta es una combinación de y a ,..., yt+i, que representa el vector cero, de esta 
manera los elementos 1 deben ser dependientes, completando así la 

demostración. 

1.8 Bases y dimensión 

definición. Un conjunto finito S de elementos de un espacio lineal V se 
llama base finita de V si S es independiente y genera V. El espacio V es de 
dimensión finita si tiene una base finita. De otro modo, V es de infinitas dimen- 
siones. 

teorema 1.6. Sea V un espacio lineal de dimensión finita. Entonces toda 
base finita de V tiene el mismo número de elementos. 

Demostración. Sean S y T dos bases fìnitas de V. Supongamos que S y T 
constan respectivamente de k y m elementos. Puesto que S es independiente y en- 
gendra V, el teorema 1.5 nos dice que todo conjunto de k + 1 elementos de V 
es dependiente. Por consiguiente, todo conjunto de más de k elementos de V es 
dependiente. Ya que T es un conjunto independiente, debe ser m <Ç k. E1 mismo 
razonamiento con S y T intercambiadas prueba que k < m. Por lo tanto k = m. 

definición. Si un espacio lineal V tiene una base de n elementos, el en- 
tero n se llama dimensión de V. Escribimos n = dim V. 

ejemplo 1. E1 espacio V„ tiene dimensión n. Una base es el conjunto de 
los n vectores coordenados unitarios. 

ejemplo 2. E1 espacio de todos los polinomios p(t) de grado < n tiene 
dimensión n + 1. Una base es el conjunto de n + 1 polinomios {l, t, t 2 , ..., t"}. 
Todo polinomio de grado < n es una combinación lineal de esos n + 1 poli- 
nomios. 

ejemplo 3. E1 espacio de las soluciones de la ecuación diferencial 
y" — 2y' — 3y = 0 tiene dimensión 2. Una base está formada por las dos fun- 
ciones u,(*) = e~ x , u^ix) = é ir . Toda solución es una combinación lineal de 
esas dos. 
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ejemplo 4. E1 espacio de todos los polinomios p(t) es de infinitas dimen- 
siones. E1 conjunto infinito {1, t, t 2 , ... } genera este espacio y ningún conjunto 
finito de polinomios genera el espacio. 

teorema 1.7. Sea V un espacio lineal de dimensión finita con dim V = n. 
Se tiene: 

a) Cualquier conjunto de elementos independiente de V es un subconjunto 
de una cierta base para V. 

b) Cualquier conjunto de n elementos indepehdientes es una base para V. 

Demostración. Para demostrar (a), consideremos el conjunto independiente 
S = {x 1( ..., Xk} constituido por elementos en V. Si L(S) — V, entonces S es una 
base. Si no, entonces hay algún elemento y en V que no está en L(S). Anadamos 
ese elemento a S y consideremos el nuevo conjunto S'^í^,...,%, y}. Si en este 
conjunto dependiente multiplicamos sus elementos por escalares c lt ... ,Ck+% 
siendo alguno diferente de cero, estableceremos que 

Ỳc iXi + c k+1 y = O . 

Pero ct+i^O puesto que x x ,... ,xu son independientes. De aquí que podamos 
resolver esta ecuación respecto a y llegando a la conclusión que yeL(S), lo que 
contradice el supuesto de que y no pertenece a L(S). Por lo tanto el conjunto S' es 
independiente y contiene k +1 elementos. Si L(S')=V, entonces S' es una base y, 
siendo S un subconjunto de S', la parte (a) queda demostrada. Si S' no es una base, 
entonces podemos proceder con S' de igual manera que procedimos con S y consi- 
derar otro nuevo conjunto S" que contiene k+2 elementos y es independiente. 
Si S" es una base, (a) queda demostrado. Si no, repetimos el proceso. Debemos 
llegar a una base después de un número fìnito de etapas, ya que de otra manera 
obtendríamos un conjunto independiente con n+1 elementos, contradiciendo el 
teorema (1.5). Por eso, la parte (a) del teorema (1.7) queda demostrada. 

Para demostrar la parte (b) consideremos un conjunto independiente S con 
n elementos. Por la parte (a), S es un subconjunto de base B. Pero por el teore- 
ma 1.6, la base B tiene exactamente n elementos, por tanto, S—B. 

1.9 Componentes 

Sea + un espacio lineal de dimensión n y consideremos una base cuyos 
elementos e,, . . . , e„ se toman en un cierto orden. Una tal base ordenada la con- 
sideramos como una n-pla (e,, ..., e„). Si xe V, podemos expresar x como una 
combinación lineal de esos elementos base: 

* = 2 c i e i ■ 


( 15 ) 
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Los coefìcientes en csta ecuación determinan una n-pla de números ( c ,, . . ., c n ) 
que está unívocamenle determinada por x. En efecto, si tenemos otra represen- 

tación de x como combinación lineal de e x . e„, por ejemplox =2f =1 d^e, , 

restando de ( 1 ,5) encontramos que 2í^i( c * ~ df)e t = O. Pero ya que los ele- 
mentos base son independientes, eso implica que Ci=di para cada i, con lo cual 
(c,, .... c«) — {d\,... ,d„). 

Los componentes de la n-pla ordenada (c,, .... c„) determinada por (1.5) 
se llaman componentes de x respecto a la base ordenada (e„ . .., e„). 


1.10 Ejercicios 


En cada uno de los ejercicios del 1 al 10, S es el conjunto de todos los vectores 
(x,y,z) de V, cuyos componentes satisfacen la condición que se da. Determinar si S es 


un subespacio de V 3 . Si lo es, calcular di 

1. x =0. 

2. x+y=0. 

3. x + y + z = 0. 

4. x = y. 

5. x = y = z. 


6. x = y o x =z. 

1. x 2 -y 2 = 0. 

8. x +y = 1. 

9. y = 2x y z = 3x. 

10. x + y + z = 0 y x—y—z= 0. 


Sea P„ el espacio lineal de todos los polinomios de grado <; n, siendo n fijo. En cada 
ejercicio del 11 al 20, sea S el conjunto de todos los polinomios / de P„ que satisfacen la 
condición dada. Determinar si S es un subespacio de P„. Si lo es, calcular dim S. 

11. /(0) = 0. 

12. /'(0) = 0. 

13. /"(0) = 0. 

14. /(0)-f/'(0) = 0. 

15. /(0) = /(l). 

16. /(0) = /(2). 

17. / es par. 

18. / es impar. 

19. / es de grado £ k, siendo k < n, o / = 0. 

20. / es de grado k, siendo k < n, o / = 0. 

21. En el espacio lineal de todos los polinomios reales p(t), describir el subespacio engen- 
drado por cada uno de los siguientes conjuntos de polinomios y determinar su dimensión. 

a) {1, t 2 , t 4 }; b) [t, t a , t 5 }; c) {/, t 2 }; d) {1 + /, (1 + tf}. 

22. En este ejercicio, L(S) es el subespacio generado por un subconjunto S de un espacio 
lineal V. Demostrar las proposiciones de la a) a la f). 

a) SÇL(S). 

b) Si S Ç TÇ V y s i T es un subespacio de V. entonces L(S) Ç p. Esta propiedad se 
expresa diciendo que L(S) es el menor subespacio de V que contiene S. 

c) Un subconjunto S de V es un subespacio de V si y sólo si L(S) = S. 

d) Si S Ç T Ç V, entonces L(S) Ç L(T). 

e) Si S y T son subespacios de V, también lo es S n T. 

f) Si S y T son subconjuntos de V. entonces L(S n T) Ç L(S) n L(T). 

g) Dar un ejemplo en el que L(S n T)^ L(S) n L(T). 

23. Sea V el espacio lineal de todas las funciones reales definidas en la recta real. Deter- 
minar si cada uno de los siguientes subconjuntos de V es dependiente o independiente. 
Calcular la dimensión del subespacio generado por cada conjunto. 
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a) { 1 , e“ x , e bx }, a * b. 

f) {cos x, sen x}. 

b) {e° x , xe ,,x }. 

g) {cos 2 jc.sen 2 x). 

c) (l,e ax , xe ax }. 

h) {l,cos2*,sen 2 x}. 

d) { e“ x , xe ax , x 2 e ax }. 

i) {senjc, sen 2x). 

e) {e x , e~ x , cosh x}. 

j) {e'cosx, e _:c senx}. 


24. Sean V un espacio lineal de dimensión finita, y S un subespacio de V. Demostrar cada 
una de las proposiciones siguientes. 

a) S es de dimensión finita y dim S < dim V. 

b) dim S = dim V si y sólo si S = V. 

c) Toda base de S es parte de una base de V. 

d) Una base de V no contiene necesariamente una base de S. 


1.11 Productos interiores, espacios euclídeos. Normas 


En la Geometría euclídea ordinaria, aquellas propiedades que cuentan con 
la posibilidad de medir longitudes de segmentos rectilíneos y ángulos formados por 
rectas se llaman propiedades métricas. En nuestro estudio de V„, defmimos las 
longitudes y los ángulos en función del producto escalar. Queremos ahora exten- 
der esas ideas a espacios linealeç más generales. Primero introduçiremos una ge- 
neralización del producto escalar, que llamaremos producto interior, y luego 
definiremos la longitud y el ángulo en función de este producto interior. 

E1 producto escalar x y de dos vectores x = (* lf ...,*„) e y = (y 1( ... y„) 
de V n se definió en el Volumen L por la fórmula 


d-6) x-y = ìx iyi . 

En un espacio lineal general, escribimos (x, y) en lugar de x • y para los productos 
interiores, y definimos el producto axiomáticamente y no mediante una fórmula. 
Esto es, establecemos unas ciertas propiedades que queremos que satisfagan los 
productos interiores y las consideramos como axiomas. 


definición. Un espacio lineal real V tiene un producto interior si a cada 
par de elementos x e y de V corresponde un número real único (x, y) que satis- 
face los siguientes axiomas cualesquiera que sean x, y, z de V y para todos los 
escalares reales c. 

1 ) ( x >ý)=(y,x) (conmutatividad, o simetría). 

2 ) (x,y + z) = (x, ý) + (x,z) (distributividad, o linealidad). 

3) c(x, y) = (cx,y) (asociatividad, u homogeneidad ). 

4) (x, x) > 0 si x O (positividad). 


Un espacio lineal con un producto interior se llama espacio real euclídeo. 




18 


Espacios lineales 


Observación: Haciendo c = 0 en (3), encontramos que (O, y) = 0 para todo y. 

En un espacio lineal complejo, un producto interior (x, y) es un número 
complejo que satisface los mismos axiomas que los del producto interior real, 
excepto el de la simetría que se reemplaza por la relación 

(l') (x, ý) — (y, x), (Simetría hermitiana\) 

siendo (>’, x) el complejo conjugado de (y, x). En el axioma de homogeneidad, el 
multiplicador escalar c puede ser cualquier número complejo. Del axioma de la 
homogeneidad y (l'), llegamos a la relación 

(3') (x, cý) = (cy, x) = c(y, x) = c(x,y). 

Un espacio lineal complejo con un producto interior se llama espacio euclídeo 
complejo. (A veces se usa también la denominación de espacio unitario.) Un 
ejemplo es el espacio vectorial complejo V„(C) brevemente discutido en la sec- 
ción 12.16 del Volumen I. 

Aunque nos interesan principalmente los ejemplos de espacios euclídeos rea- 
les, los teoremas de este capítulo son válidos para espacios euclídeos complejos. 
Cuando decimos espacio euclídeo, sin más, entenderemos que puede ser real o 
complejo. 

E1 lector debiera comprobar que cada ejemplo que sigue satisface todos los 
axiomas del producto interior. 

ejemplo 1. En V„ sea (x, y) = x ■ y, el producto escalar ordinario de x e y. 

ejemplo 2. Si x = (x, ,x 2 ) e y = (y, ,y 2 ) son dos vectores de V 2 , defini- 
mos (x, y) mediante la fórmula 

(x,y) = 2x^ + x x y 2 + x 2 >! + x 2 y 2 . 

Este ejemplo pone de manifiesto que pueden existir más de un producto interior 
en un espacio lineal dado. 

ejemplo 3. Sea C(a,b) el espacio lineal de todas las funciones reales con- 


t En honor de Charles Hermite (1822-1901) matemático francés que contribuyó mucho 
al desarrollo del álgebra y del análisis. 



Productos interiores, espacìos euclídeos. Normas. 19 

tinuas en un intervalo [a, 6]. Defmamos un producto interior de dos funciones 
/ y g con la fórmula 


(/, g) =/V(f)g(0 dt. 

Esta fórmula es análoga a la ecuación (1.6). que define el producto escalar de dos 
vectores en V„. Los valores de Ias funciones /(f) y g(t) desempeiian el papel de 
los componentes x, e y<, y la integración el de la suma. 

ejemplo 4. En el espacio C(a, b), defmimos 

(/> g) =j a w(0/(0g(0 dt, 

donde w es una función positiva fija de C(a, b.). Tal función se llama función peso. 
En el ejemplo 3 tenemos w(t) = 1 para todo t. 

ejemplo 5. En el espacio lineal de todos los polinomios reales, defmimos 
(/,g) = / ” e _í /(0g(0 dt. 

Debido al factor exponencial, esta integral impropia converge para todo par de 
polinomios / y g. 

teorema 1.8. En un espacio euclídeo V, todo producto interior satisface 
la desigualdad de Cauchy-Schwarz: 

\( x >y)\ ì ^ (a', x)(y,ý) para todo x y ftodo yenV. 

Además, el signo de igualdad es válido si y sólo si x e y son dependientes. 

Demostración. Si ocurre que o bien x=0 o y=0 la demostración es 
trivial. Supongamos que reyno son ambas cero. Sea z=ax+by en donde a y b 
son escalares que especificaremos después. Tenemos la desigualdad (z,z) ^ 0 para 
todo a y b. Cuando expresamos esta desigualdad en funcíón de x e y con una 
elección apropiada de a y b, obtenemos la desigualdad de Cauchy-Schwarz. 

Para expresar (z,z) en función derey usaremos las propiedades (10. (2) 
y (3'), obteniendo 

(z, z) = (ax + by,ax + by ) = (ax, ax) + (ax, by) + (by, ax) + (by, bý) 

— aà(x, x) + aí(x,ý) + bâ(y, x) + bb(y, y) > 0. 
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Tomando a=( y,y) y suprimiendo en la desigualdad el factor positivo (y,y), 
resulta 

(y,y)(x, x) + b(x, y) + b(y, x) + bb ^ 0. 

Ahora, hagamos b=—(x,y). Entonces, b=—(ypc) y la última desigualdad, 
una vez simplificada, toma la forma 

(y, y)(x, x) ^ (x, y)(y, x) = |(x, y )| 2 . 

Esto demuestra la desigualdad de Cauchy-Schwarz. E1 signo de igualdad es válido 
si y sólo si z=0. Esto ocurre si y sólo si x e y son dependientes. 


ejemplo. Aplicando el teorema 1.8 al espacio C(a,b) con el producto 
interior (/, g) = J* f(t)g(t) dt, encontramos que la desigualdad de Cauchy-Schwarz 
se transforma en 


(JV(0g(0 dtf< dt)^ g\t) dt) . 


E1 producto interior puede utilizarse para introducir el concepto métrico de 
longitud en cualquier espacio euclídeo. 

definición. En un espacio euclídeo V, el número no negativo ||*|| definido 
por la ecuación 


11*11 = (X, x) 1/2 

se denomina norma del elemento x. 

Cuando la desigualdad de Cauchy-Schwarz se expresa en función de las nor- 
mas, toma la forma 


l(*,J')l < 11*11 llyll • 

Puesto que es posible definir un producto interior de muchas maneras, la 
norma de un elemento dependerá del producto interior elegido. Esta falta de uni- 
cidad era de esperar. Este hecho es análogo al de que podemos asignar números 
distintos a la medida de la longitud de un segmento rectilíneo dado, según la 
elección de escala o unidad de medida. E1 teorema que sigue da las propiedades 
fundamentales de las normas que no dependen de la elección de producto interior. 
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teorema 1.9. En un espacio euclídeo, toda norma tiene las propiedades 
siguientes para todos los elementos x e y, y todos los escalares c: 

a) 11*11 =0 si x = O. 

b) ||*|| > 0 si x/O ( positividad ). 

c) ||c*|| = |c| ||*|| ( homogeneidad ). 

d) II* + /|| < ||*|| + ||/1| (desigualdad triangular). 

El signo de igualdad es válido en la desigualdad triangular si y sólo si x e y son 
dependientes. 

Demostración. Las propiedades a), b) y c) se deducen inmediatamente de 
los axiomas del producto interior. Para demostrar d) observemos que 

II* + /II 2 = (* + /,* + /) = (*, *) + (/,/) + (*,/) + (/, *) = 

= ii*ii 2 + ii/ii 2 + (*,/) + (+7). 

La suma (x, y) + (x, /) es real. La desigualdad de Cauchy-Schwarz prueba que 
|(x,y)| < ||x|| ||y|| y que |(7/)| < ||x|| ||y||, así que tenemos 

II* + /II 2 < ll*ll 2 + ll/ll 2 + 21|x|| H/ll = (||x|| + Il/H) 2 . 

Esto demuestra d). E1 signo de igualdad en d) es válido siempre que lo sea en la 
desigualdad de Cauchy-Schwarz. Cuando y = cx, siendo c > 0, tenemos 

II* +/II = II* + cxll = (1 + c) ||x|| = ||x|| + ||cx|| = ||X|| + ll/ll. 


definición. En un espacio euclídeo real V, el ángulo formado por dos ele- 
mentos no nulos x e y se define como el número 6 del intervalo 0 < 6 < n que 
satisface la ecuación 

0 . 7 ) 

11*11 llyll 

Observación: La desigualdad de Cauchy-Schwarz prueba que el cociente del se- 
gundo miembro de (1.7) está en el intervalo [ — 1,1], así que existe sólo un 8 en 
[0, tt] cuyo coseno es igual al de este cociente. 

1.12 Ortogonalidad en un espacio euclídeo 

definición. En un espacio euclídeo V, dos elementos x e y se llaman orto- 
gonales si su producto interior es cero. Un subconjunto S de V es un conjunto 
ortogonal si (*, y) = 0 para todo par de elementos distintos x e y de S. Un con- 
junto ortogonal se llama ortonormal si cada uno de sus elementos tiene norma 1. 
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E1 elemento cero es ortogonal a todo elemento de V ; es el único elemento 
ortogonal a sí mismo. E1 siguiente teorema demuestra una relación entre ortogona- 
lidad y dependencia. 

teorema 1.10. En un espacio euclídeo V, todo conjunto ortogonal de 
elementos no nulos es independiente. En particular, en un espacio euclídeo de 
dimensión finita con dim V = n, todo conjunto ortogonal que conste de n ele- 
mentos no nulos es una base para V. 

Demostración. Sea S un conjunto ortogonal de elementos no nulos de V, 
y supongamos que una cierta combinación lineal finita de elementos de S es cero, 
sea 


2 c ì x ì = O, 


donde cada x { e S. Formando el producto escalar de cada miembro por x, y 
teniendo en cuenta que (.*:, ,xi) = 0 si i¥= 1, encontramos que cdx x .x^) = 0. 
Pero (*, ,Xi)¥0 ya que x^¥ O con lo cual c, = 0. Repitiendo el razonamiento 
cambiando x x por X/, encontramos que cada C/ = 0. Esto prueba que S es indepen- 
diente. Si dim V = n y si S consta de n elementos, el teorema 1.7 b) demuestra 
que S es una base para V. 

ejemplo. En el espacio lineal real C( 0, 2tt) con el producto interìor 
(/, g) = Jo *f( x )g( x ) dx, sea S el conjunto de las funciones trigonométricas { u„, 
u,, « 2 , ... } dadas por 

u 0 (x) = 1, K 2n -i(*) = cos nx, u 2n (x) = sen nx, para n = 1,2. 

Si m¥= n, tenemos las relaciones de ortogonalidad 

jT*'« B (x)u m (jc) dx = 0, 

así que S es un conjunto ortogonal. Puesto que ningún elemento de S es el ele- 
mento cero, S es independiente. La norma de cada elemento de S se calcula fácil- 
mcnte. Tenemos (u 0 , u 0 ) = §1" dx = 2* y, para n ^ 1, tenemos 


(«2n-i. «2n-i) = | o cos 2 nx dx = 7T, (u 2n , u in ) ^J^sen 2 nxdx = n. 
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Por consiguiente, ||u 0 || = V 27 r y \\u n || = Vrr para « > 1. Dividiendo cada u„ por 
su norma, obtenemos un conjunto ortonormal {ç> 0 ,xp x ,<pi, ... } donde (p„—u n /\\u n \. 
Así pues, tenemos 

. . 1 . . cos nx , . sen nx . . 

<Po(x) = , <P 2 n -ito = -^=-, <P ÎK (x) = —f=- , para n > 1. 

En la sección 1.14 demostraremos que todo espacio euclídeo de dimensión 
finita tiene una base ortogonal. E1 teorema que sigue muestra cómo se calculan 
los componentes de un elemento relativos a una tal base. 

teorema 1.11. Sea V un espacio euclídeo de dimensión finita n, y supon- 
gamos que S = {e u ..., e„) es una base ortogonal para V. Si un elemento x está 
sxpresado como una combïnación lineal de los elementos de la base, sea ésta 

0 -8) x = Ìc ( e iy 

entonces sus componentes relativos a la base ordenada (e lỳ ..., e„) vienen dados 
por las fórmulas 

(1.9) = Para j = 1,2,...,n. 

En particular, si S es una base ortonormal, cada Cj viene dada por 

(1.10) c, = (*,<?,). 

Demostración. Formando el producto interior de cada miembro de (1,8) 
con e„ obtenemos 

(x, ej) = Ỳ c i( e i’ e ì) = c i( e i, e í) 

Puesto que (e,, ej) = 0 si i¥= j. Esto implica (1.9), y cuando (e,-, ej) = 1, obte- 
nemos (1.10). 

Si {e^, ..., e„} es una base ortonormal, la ecuación (1.9) puede escribirse 
en la forma 


(1.11) 


= J,(x, ej)e ( . 
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E1 siguiente teorema prueba que en un espacio euclídeo real de dimensión 
finita con una base ortonormal el producto interior de dos elementos es igual a la 
suma de los productos de sus componentes. 

teorema 1.12. Sea V un espacio euclídeo real de dimensión finita n, 
y supongamos que {e lt ..., e„} es una base ortonormal para V. Para todo par de 
elementos x e y de V, tenemos 

(1.12) (x, y) — e ì)(y> e ì) ( Fórmula de Parseval). 

En particular, cuando x = y, tenemos 


(1-13) N| 2 = Ìl(x,e < )|*. 

Demostración. Formando. el producto interior de ambos miembros de la 
ecuación (111) con y, y aplicando la propiedad de linealidad del producto inte- 
rior, obtenemos (1.12). Cuando x = y, la ecuación (1.12) se reduce a (1.13). 

Observación: La ecuación (1.12) se denomina como se indica en honor 'de 
M. A. Parseval (aproximadamente 1776-1836), que obtuvo este tipo de fórmula en un 
espacio funcional especial. La ecuación (1.13) es una generalización del teorema de 
Pitágoras. 


1.13 Ejercicios 

1. Sean x = (*,,... ,x n ) e y = (y,.... ,y„) vectores arbitrarios de V„. Determinar en cada 
caso, si (x, y) es un producto iriterior en V„, si ( x, y ) está definido por la fórmula que se 
da. En el caso en que (x,y) no sea un producto interior, decir cuáles son los axiomas 
que no se satisfacen. 

a) (x, y ) =j| d) (x, y) = xfyïj'*. 

b) (x,y) e) (x,y) =|(x t + ytf -j>? -j yf. 

c) (x,y) =Ì*,Ìy á . 

2. Supongamos que mantenemos los tres primeros axiomas del producto interior real 
(simetría, linealidad y homogeneidad) pero reemplazamos el cuarto axioma por uno nue- 
vo (4'): (x, x) = 0 si y sólo si x = O. Demostrar que o (x,x) > 0 para todo x ^ O 
o bien (x, x) < 0 para todo x ^ O. 
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[Indicación: Suponer (x, x) > 0 para un cierto x ^ O y (y,y) < 0 para un cierto 
y O. En el espacio generado por {x, y}, hallar un elemento z ^ O con (z, z) = 0.] 

Demostrar que en los ejercicios del 3 al 7 cada una de las proposiciones es válida para 
todo par de elementos x e y de un espacio euclídeo real. 

3. (x,y) = 0 si y sólo si ||x + y[\ = \\x -_y||. 

4. ( x,y ) =0 si y sólo si \\x + jll 2 = IWI 2 + lljll 2 . 

5. (x,y) =0 si y sólo si ||x + cy|| > ||x|| para todo c real 

6. (x +y,x -y)= Osi y sólo si ||x|| = ||+||. 

7. Si x e y son elementos no nulos que forman un ángulo 0, entonces 

llx - y\\* = llxll* + lljll 2 - 2 llxll ll+ll cos B . 

8. En el espacio lineal real C(l, e), definimos un producto interior por 

(fg) = J‘ (log x)f(x)g(x) dx . 


a) Si f(x) = Vx. calcular ||/||. 

b) Hallar un polinomio de primer grado g(x) = a + bx que sea ortogonal a la función 
constante f(x) =1. 

9. En el espacio lineal real C( —1, 1), sea (/, g) f(t)g(t)dt. Considerar las tres fun- 
ciones u ,, u 2 « 3 dadas por 

iq(í) = 1 , u 2 (t) = t, u 3 (t) = 1 + t. 

Demostrar que dos de ellas son ortogonales, dos forman entre sí un ángulo tt/ 3, y dos 
forman entre sí un ángulo ir/B. 

10. En el espacio lineal P„ de todos los polinomios reales de grado < «, defmimos 

a) Demostrar que (/, g) es un producto interior para P n . 

b) Calcular (/, g) cuando f(t) = t y g(t) = at + b. 

c) Si f(t) = í, hallar todos los polinomios g ortogonales a /. 

11. En el espacio lineal de todos Ios polinomios reales, definimos (/, g) = $o e~ l f(t)g(t)dt. 

a) Demostrar que esa integral impropia converge absolutamente para todos los polino- 
mios / y g. 

b) Si x n (t) = t * para n = 0, 1, 2, .... demostrar que (x„, x„) = (m + n)\ . 

c) Calcular (/, g) cuando f(t) = (t + l) 2 y g(t) = t 2 + 1. 

d) Hallar' todos los polinomios de primer grado g(t) = a + bt ortogonales a /(í) = l + f, 

12. En el espacio lineal de todos los polinomios reales, determinar si (/, g) es o no ur. 
producfo interior cuando se define (/,g) con la fórmula que se da. En el caso en que 
(/,g) no es un producto interior, indicar qué axiomas no son respetados. En c), f y 
g' indican derivadas. 
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a) (f g) - /(%0). c) (/, g) =/ o V'(%'W dt. 

b) ( /’^ “ | /o*|- d) (/*) = (/ o /W<*)(/>)*). 

13. V está formado con todas las sucesiones indefmidas de números reales {*„} para los 
cuales las series x 2 n convergen. Si x = { x „} e y = {y„} son dos elementos de V , 
defmimos 

(x,ý) =2*«?« ■ 

a) Demostrar que esta serie converge absolutamente. 

[ Indicaciótt: Usar la desigualdad de Cauchy-Schwarz para aproximar la suma 

2.n-l IWnl-]; 

b) Demostrar que V es un espacio lineal con ( x , y ) como producto interior. 

c) Calcular ( x , y ) six„ = 1 /n e y„ = l/(n + 1) para n > 1. 

d) Calcular ( x , y ) si x n = 2* e y„ =l/n! para n > 1. 

14. Sea V el conjunto de todas las funciones reales / continuas en [0, +~) y tales que la 
integral J* e~*f 2 (t)dt converge. Defìnamos(/, g) = J” e~*f(t)g(t)dt. 

a) Demostrar que la integral que da (/,g) converge absolutamente para cada par de 
funciones / y g de V. 

[Indicación: Apiicar la desigualdad de Cauchy-Schwarz para aproximar la inte- 
gral e-*\f(t)g(t)\dt.} 

b) Demostrar que V es un espacio lineal con (f,g) como producto interior. 

c) Calcular (/, g) si f(t) = e~* y g(t) =t n , donde it = 0, 1, 2, ... . 

15. En un espacio euclídeo complejo, demostrar que el producto interior tiene las siguientes 
propiedades para todos los elementos x , y,z y todos los complejos a y b . 

a) (ax, by) = ah(x, y). b) (jc, ay + bz) = â(x, y) + h(x, z). 

16. Demostrar que en todo espacio euclídeo son válidas las identidades siguientes. 

a) |x + j||» = ||x||* + \\y\\* + (x,y) + (y, x). 

b) ||x + y\\* - ||x -y\\* = 2 (x,y) + 2 (y,x). 

c) llx + 7 II» + ||x — _y||* = 2 ||x||* + 2 ||_y||*. 

17. Demostrar que el espacio de todas las funciones complejas continuas en un intervalo 
[a, b] se transforma en un espacio unitario si defìnimos un producto interior por la 
fórmula 

(fg) =iyôf(t)gU)dt, 

donde w es una función positiva fija, continua en [ a , 6]. 


1,14 Construcción de conjuntos ortogonales. Método de Gram-Schmidt 

Todo espacio lineal de dimensión finita tiene una base finita. Si el espacio es 
euclídeo, podemos construir siempre una base ortogonal. Este resultado se dedu- 
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cirá como consecuencia de un teorema cuya demostración ensena a construir 
conjuntos ortogonales en cualquier espacio euclídeo, de dimensión finita o de 
infinitas dimensiones. La construcción se llama método de Gram-Schmidt, en me* 
moria de J. P. Gram (1850-1916) y E. Schmidt (1845-1921). 

TEOREMA 1.13. TEOREMA DE ORTOGONALIZACIÓN. Sea X t , X 2 , , Una SU- 

cesión finita o indefinida de elementos de un espacio euclídeo V, y designemos 
con L(x lt .... Xk) el subespacio generado por los k primeros de esos elementos. 
Existe una sucesión correspondiente de elementos y„ y 2 , ..., de V que tiene las 
siguientes propiedades para cada entero k: 

a) El elemento yk es ortogonal a todo elemento del subespacio L( y 1( ... y k-i). 

b) El subespacio generado por y t , .... yk es el mismo que el generado 
por x t , .... Xk: 


Uyi,...,y k ) = Hxx k ). 

c) La sucesión y t , y 2 , .... es única, salvo factores escalares. Esto es, si 
y[, yí,..., es otra sucesión de elementos de V que satisfacen las propiedades a) 
y b), entonces para cada k existe un escalar c k tal que y' k = c k y k . 

Demostración. Construyamos los elementos y„ y 2 , ..., por inducción. Para 
iniciar el proceso, tomamos y, = x t . Supongamos ahora que hemos construido 
y„ ..., y, de modo que a) y b) se satisfacen cuando k — r. Definamos y r +, me- 
diante la ecuación 

(1.14) y r+ i = x r+1 - j a^y,, 

donde los escalares a,, ..., a, tienen que determinarse. Para j < r, el producto 
interior de y r +, con y, viene dado por 

Or+ 1 , yi) = (x r+1 , yj) - í atiyt, y 3 ) = (x r+1 , y,) - a/y,, y,) , 

puesto que (y,-,y,) = 0 si i #/. Si y^O, podemos hacer y r+1 ortogonal a y,- 
tomando 

(1.15) q _0j r +i,y,) 

(y„y<) ‘ 

Si y,- = O, entonces y r +, es ortogonal a y, para cualquier a,- que se elija, en este 
caso elegimos a, = 0. Así pues, el elemento y r+1 está bien definido y es ortogonal 
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a cada uno de los anteriores elementos y,, .... y r . Por consiguiente, es ortogonal 
a todo elemento del subespacio 


Uyi .Jr)- 

Esto demuestra a) cuando k = r + 1. 

Para demostrar b) cuando k = r + 1 , tenemos que probar que 

L( yi ./ r+ i) = L( Xl ,.. x r+1 ), dado que L(y x ,... ,y r ) = L(x t ,, x r ). 

Los r primeros elementos y v ..., y, pertenecen a 

L(x j ,... ,x r ) 

y por tanto están en el subespacio más amplio L(x t ,..., x r+l ). E1 nuevo elemen- 
to y r+ì dado por (1.14) es una diferencia de dos elementos de L( Xl ...., x r+1 ) 
así que también está en L(xi,..., x r+l ). Esto demuestra que 

Uy,. .J r+ i) £ L( Xl ,..., x r+l ). 

La ecuación (1.14) prueba que x r+1 es la suma de dos elementos àtL(y x ,... ,y r+ i) 
con lo que un razonamiento análogo da la inclusión en el otro sentido: 

L( Xl ,..., x r+1 ) £ L(y t .... ,y r+1 ) . 

Esto demuestra b) cuando k = r + 1. Por lo tanto a) y b) han sido demostrados 
por inducción respecto de k. 

Finalmente demostramos c) por inducción respecto de k. E1 caso íc = 1 es 
trivial. Por consiguiente, supongamos que c) es cierto para k = r y consideremos 
el elemento y++1 . En virtud de b), este elemento pertenece a 


L(yi , • • •, y++i) , 


así que podemos escribir 


y'r+l = 2 C iyt = Z r + C r+1 y r+1 , 


donde z r e L(y u ..., y r ). Queremos demostrar que z r = O. Por la propiedad 
a), y^ y c r+1 y r+1 son ambos ortogonales a z r . Por consiguiente, su diferencia, z r , 
es ortogonal a z r . Dicho de otro modo, z r es ortogonal a sí mismo, así que 
z r = O. Esto completa la demostración del teorema de ortogonalidad. 

En la construcción anterior, puede suceder que y r +i = O para algún r. Enton- 
ces (1 .14) prueba que x r+1 es una combinación lineal de y,, ..., y„ y por tanto 
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de x u , x r , así que los elementos x lt , x r +i son dependientes. En otras pa- 
labras, si los Jc primeros elementos x lt ..., Xk son independientes, los elementos 
correspondientes y lt ... ,yk son no nulos. En este caso los coeficientes a,- de (1.14) 
vienen dados por (1.15), y las fórmulas que definen y lt ... ,yk se convierten en 

(1.16) ^ +1 = ^ + i-2^y^ para r = l , 2 ,..., k - l . 

Estas fórmulas constituyen el método de Gram-Schmidt para construir un conjunto 
ortogonal de elementos no nulos y lt ..., yk que generan el mismo subespacio que 
el conjunto independiente dado x lt ... Xk. En particular, si x u ..., Xk es una 
base para un espacio euclídeo de dimensión finita, entonces y„ ..., y* es una base 
ortogonal para el mismo espacio. También podemos convertir ésta en una base 
ortonormal normalizando cada uno de los elementos y,-, esto es, dividiéndolo por 
su norma. Por consiguiente, como corolario del teorema 1.13 tenemos el si- 
guiente. 

teorema 1.14. Todo conjunto euclídeo de dimensión finita tiene una base 
ortonormal. 

Si x e y son elementos en un espacio euclídeo, con y ¥= O, el elemento 

(x,y) 

(y,y) 



cy„ c 


(*2, yQ 

(yi.yi) 


Figura 1 .1 El método de Gram-Schmidt en V 3 . Un conjunto ortogonal {y^, y 2 , y 3 } 
se construye a partir de un conjunto independiente {x t , x 2 , x a }. 
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se llama la proyección de x sobre y. En el método de Gram-Schmidt (1.16), 
construimos el elemento y r+í restando de x r+1 la proyección de x r+1 sobre cada 
uno de los anteriores elementos y,, .... y r . La figura 1.1 representa la construc- 
ción geométrica en el espacio vectorial V 3 . 

ejemplo 1. En V4 , hallar una base ortonormal para el subespacio generado 
por los tres vectores Xl = (1, —1, 1, —1), x 2 = (5, 1, 1, 1,), y x 3 = (—3, —3, 
1, -3). 

Solución. Aplicando el método de Gram-Schmidt, encontramos 
y 1 = x 1 = (1,-1,1,-1), 
y 2 = x 2 - ^ y^ = x a - y^ = (4, 2, 0, 2) , 

.3==x 3 -^y 1 -^y 2 = X3-y 1 + y s = (0,0,0,0). 

O'i.yO (J'a.i'î) 


Puesto que y a = O, los tres vectores x lt x 2 , x 3 deben ser dependientes. Pero ya 
que y, e y 2 son no nulos, los vectores x, y x 2 son independientes. Por consiguiente 
L(x u x 2 , x 3 ) es un subespacio de dimensión 2. E1 conjunto {y,, y 2 } es una base 
ortogonal para ese subespacio. Dividiendo y, e y 2 cada uno por su norma llegamos 
a una base ortonormal que consta de dos vectores 


_Zl_ = 1 

llj'ill 2 


( 1 ,- 1 , 1 ,- 1 ) 


-1* _L 

llj'.ll V6 


( 2 , 1 , 0 , 1 ). 


ejemplo 2. Polinomios de Legendre. En el espacio lineal de todos los po- 
linomios, con el producto interior (x,y) =JL x(t) y(t) dt, consideramos la sucesión 
indefinida x„, x lt x 2 , .. ., donde x„(t) = t n . Cuando se aplica a esa sucesión el 
teorema de ortogonalización se transforma en otra sucesión de polinomios 
y<u y,, y 2 , .... que el matemático francés A. M. Legendre (1752-1833) fue el 
primero en encontrar en su trabajo sobre la teoría del potencial. Los primeros de 
esos polinomios se calculan fácilmente con el método de Gram-Schmidt. Ante 
todo, tenemos y 0 (/) = x„(t) = 1. Puesto que 

(l'o , y 0 ) =1^ dt = 2 y ( Xl , y 0 ) =J* í dt = 0 , 


encontramos que 
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A continuación, utilizâmos las relaciones 


= í i t2dt = 3’ ( x 2> yJ =j dt = 0 , (Ji, ^i) = J t 2 dt = \ 


para obtener 


(y®, j'o) (yi , yi) 


1 

3 ' 


Del mismo modo, encontramos que 


y*(t) = t*- 3 -t, y t (t) = t* - ~t 2 + j- 5 , y 5 (t) = Í s _ ^ Í s + ^ t . 

En el capítulo 6 encontraremos de nuevo esos polinomios en el estudio de las 
ecuaciones diferenciales, y probaremos que 




Los polinomios P„ dados por 


Pn(t) - 


-^^(O-—-(<■_!)" 

2”(n!) 2 V.dl"' 


se conocen con el nombre de polinomios de Legendre. Los polinomios de la su- 
cesión ortonormal correspondiente <p (l , <p lt <p 2 , ..., dados por <p n — y„/||y«|| se 
llaman polinomios de Legendre normalizados. De las fórmulas para y 0 , . .., y 5 
dadas antes, encontramos que 


Vo (0 = , íPi(t) = J\t, <p 2 (t) = 


<PÁt) = iJl (3 5 « 4 - 30( 2 + 3), 


\Jl(3t 2 - 1) , <p a (t) = ^(5í 3 - 3í), 
<Pa(t) = (63í 5 - 70í 3 + 15f) . 


1.15 Complementos ortogonales. Proyecciones 

Sean V un espacio euclídeo y S un subespacio de dimensión finita. Vamos 
a considerar el siguiente problema de aproximación: Dado un elemento x de 
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V, determinar un elemento en S cuya distancia a x sea lo más pequena posible. 
La distancia entre dos elementos x e y se defìne como la norma ||x — yj:. 

Antes de discutir este problema en su forma general, consideremos un caso 
particular, representado en la figura 1.2. Aquí V es el espacio vectorial V 3 y S es 
un subespacio de dimensión dos, un plano que pasa por el origen. Dado x de V, 
el problema consiste en encontrar, en el plano S, el punto s más próximo a x. 

Si x e S, evidentemente la solución es s = x. Si x no pertenece a S, el punto 
más próximo s se obtiene trazando una perpendicular desde x al plano. Este sen- 
cillo ejemplo sugiere una introducción al problema general de aproximación y da 
origen a la discusión que sigue. 

definición. Sea S un subconjunto de un espacio euclídeo V. Se dice que un 
elemento de V es ortogonal a S si es ortogonal a todo elemento de S. El conjunto 
de todos los elementos ortogonales a S se designa con S'- L y es el «perpendicular 
a S». 

Es un ejercicio sencillo comprobar que S 1 es un subespacio de V, tanto, 
si S lo es comosinolo es. En el caso en que S sea un subespacio, entonces S 1 se 
llama complemento ortogonal de S. 

ejemplo. Si S es un'plano que pasa por el origen, como se ve en la figu- 
ra 1.2, entonces S 1 es una recta por el origen perpendicular a ese plano. Este 
ejemplo da también una interpretación geométrica para el teorema siguiente. 



Figura 1 .2 Interpretación geométrica del teorema de descomposición ortogonal en V 3 . 
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TEOREMA 1.15. TEOREMA DE LA DESCOMPOSICION ORTOGONAL. Sean V Un 
espacio euclídeo y S un subespacio de V de dimensión finita. Todo elemento x 
de V puede representarse en forma única como una suma de dos elementos, uno 
de S y otro de S 1 . Esto es, tenemos 

(1-17) x = s + s x , donde seS y s 1 e S 1 . 

Además, la norma de x viene dada por la fórmula pitagórica 

0-18) ll*ll 2 = M 2 + |[5 1 P. 

Demostracìón. Demostremos primero que existe en realidad una descom- 
posición ortogonal (1.17). Puesto que S es de dimensión fìnita, tiene una base 
ortonormal finita, sea ésta {e„ .... e„}. Dado x, defmimos los elementos sys 1 
así: 


(1.19) s = 2 ( x > e ò e i . s x = x — s . 

Observemos que cada término (x, e,)e, es la proyección de x sobre et. E1 elemen- 
to s es la suma de las proyeccciones de x sobre cada elemento de la base. Puesto 
que s es una combinación lineal de los elementos de la base, s está en S. La defi- 
nición de s- 1 - prueba que la ecuación (1.17) es válida. Para demostrar que s 1 
está en S x , consideremos el producto interior de s- 1 - y cualquier elemento e,- de la 
base. Tenemos 


(s- 1 -, e } ) = (x - s, e,) = (x, e,) - (s, e,) . 

Pero de (1.19), encontramos que (s, ef) = (x, ej), así que s- 1 - es ortogonal a e,-. 
Por consiguiente s-L es ortogonal a todo elemento de S, lo cual significa que 
s- 1 - e S-k 

Probamos a continuación que la descomposición ortogonal (1.17) es única. 
Supongamos que x tuviera dos descomposiciones, sean éstas 

(1.20) x = s + s-L y x = t + f-L, 

donde s y t están en S, y s-^- y /-*- están en S- 1 -. Queremos demostrar que s = t y 
De (1.20), tenemos s — t = í- 1 — s-L así que sólo necesitamos demos- 
trar que s — t = O. Pero s — t e S y r- 1 — s^-eS-L con lo que s — t es orto- 
gonal a / J — s-*-e igual a / J — s-*-. Puesto que el elemento cero es el único ele- 
mento ortogonal a sí mismo, debe ser s — t = O. Esto demuestra que la descom- 
posición es única. 
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Finalmente, demostremos que la norma de x viene dada por la fórmula pita- 
górica. Tenemos 

ll-vll 2 = (-v, x) = (s + s + i L ) = (s, s) + (s 1 -, j J ) , 

siendo nulos los restantes términos ya que s y s L son ortogonales. Esto demues- 
tra (1|.18). 

definición. Sea S un subespacio de dimensión finita de un espacio euclídeo 
V, y sea {e t , ..., e „} una base ortonormal para S. Si x e V, el elemento s def i- 
nido por la ecuación 

s = Ì(x,e t ) ei 

se denomina proyección de x sobre el subespacio S. 

Demostramos seguidamente que la proyección de * sobre S es la solución 
del problema de aproximación establecido al comienzo de esta sección. 


1.16' Aproximación óptima de elementos de un espacio euclídeo por elementos 
de un subespacio de dimensión finita 

teorema 1.16. teorema de aproximación. Sea S un subespacio de di - 
mensión finita de un espacio euclídeo V, y sea x un elemento de V. La proyección 
de x sobre S es más próxima a x que cualquier otro elemento de S. Esto es, si s 
es la proyección de x sobre S, tenemos 

II* - Jll < II* - 'II 

para todo t de S; es válido el signo de igualdad si y sólo si t = s. 

Demostración. En virtud del teorema 1.15 podemos escribir x = s + s-, 
donde seS y s 1 e S- 1 . Entonces, para cualquier t de S, tenemos 

x — t = (x — s) + (s — t) . 

Puesto que s — t e S y x — s = s' eS', ésta es una descomposición ortogonal 
de x — t, así que su norma viene dada por la fórmula pitagórica 

II* -Z|| 2 = ||.Y-SP+ ||s-t|| 2 . 
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Pero ||s — í|| 2 > 0, con lo que ||x — <|| 2 > ||x — s|| 2 , valiendo el signo igual si 
y sólo si s = t. Esto completa la demostración. 

ejemplo 1. Aproximación de funciones continuas en [0, 2n] ,por polino- 
tnios trigonométricos. Sea V = C(0, 2n), el espacio lineal de todas las funciones 
reales continuas en el intervalo [0, 2?r], y definamos un producto interior mediante 
la ecuación (/, g) — J’ 2 * f(x)g(x) dx. En la sección 1.12 vimos un conjunto orto- 
normal de funciones trigonométricas <P„, <p,, <P 2 , ..., donde 


1 , . cos kx , . sen kx , _ . 

(1.21) <p 0 (x) = , <P 2 k ~i(x) = -j=- , <p n (x) = -^=- , para k > 1 . 

Los 2« + 1 elementos %, <p x , ..., <p w generan un subespacio S de dimensión 
2n + 1. Los elementos de S se llaman polinomios trigonométricos. 

Si f e C(0, 2 tt), sea /„ la proyección de / sobre el subespacio S. Tenemos 
entonces 

(1-22) /„ =2.(f> <Pk)<Pk >, donde (/, <p k ) = \l’f(x)<p k (x) dx . 


Los números (/, <pk) se llaman coeficientes de Fourier de /. Aplicando las fórmu- 
las (1.21), podemos poner (1.22) en la forma 


(1.23) f n (x) = %a 0 + Ỳ(a k cos kx + b k sen kx) , 

donde 


a k = ^ J f(x) cos kx dx , b k = ^ J f(x) sen kx dx 

para k = 0, 1, 2, ..., n. E1 teorema de aproximación nos dice que el polinomio 
trigonométrico (1.23) aproxima / mfejor que cualquier otro polinomio trigono- 
métrico de S, en el sentido de que la norma ||/ — /„|| es la más pequena posible. 

ejemplo 2. Aproximación de funciones continuas en [ — 1, 1] por polino- 
mios de grado < n. Sea V = C(— 1, 1), el espacio de las funciones reales con- 
tinuas en [ — 1, 1], y sea (f,g) = jf k f(x) g(x) dx. Los n + 1 polinomios de Le- 
gendre normalizados <p 0 , <p,, .... <p n , introducidos en la sección 1.14, generan un 
subespacio S de dimensión n + 1 que consta de todos los polinomios de grado 
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<n. Si / e C( — 1, 1), designemos con f„ la proyección de / sobre S. Tenemos 
entonces 


fn <Pk)<Pk > donde (/, <p k ) =J f(t)<p k (t) dt. 

Este es el polinomio de grado < n para el que la norma ||/ — /„|| es la menor. 
Por ejemplo, cuando f(x) = sen nx, los coeficientes (/, <Pk) vienen dados por 

(/> <Pk) =J sen nt <p k (t) dt. 

En particular, tenemos (/, %) = 0 y 

(/. <Pi) =J ^ J\ t sen nt dt = Jì -. 

Por consiguiente el polinomio de primer grado f k (t) más próximo a sen77Í en 
[-1, 1] es 


fi(t) = Jll<Pi(t) = lt. 

Puesto que (/, %) = 0, este es también la mejor aproximación cuadrática. 


1.17 Ejercicios 


1. En cada caso, hallar una base ortonormal para el subespacio de V 3 generado por los 
vectores dados. 

a) Xl = (1,1,1), v, = (1,0,1), x 3 = (3, 2, 3). 

b) Xl = (1, 1, 1), x, =(-1,1, -1), * 3 = (1,0,1). 

2. En cada caso, hallar una base ortonormal para el subespacìo de V 4 generado por los 
vectores dados. 

a) = (l 1,0,0), x 2 =(0,1, 1,0), * 3 =(0,0, 1, 1), x 4 = (1,0,0, 1). 

b) Xl = (1, 1,0, 1), = (1,0, 2,1), x 3 = (1, 2, -2, 1). 

3. En el espacio lineal real C(0, ir) con producto interior (x, y) = jg x(t)y(t)dt, sea 
x„(t) = cos nt para n = 0, 1, 2, ... . Demostrar que las funciones y n , y , y 2 , ..., dadas 
por 



forman un conjunto ortonormal que genera el mismo subespacio que x n , x v x 2 , ... 
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4. En el espacio lineal de todos los polinomios reales, con producto interior (x, y) = 
J* x(t)y(t)dt, sea x„(t) = t’ para n = 0, 1, 2, ... . Demostrar que las funciones 

jo(í) = 1 , yi (t) = VI (2t - 1) , y 2 (t) = a/ 5 (6t 2 - 6í + 1) 

forman un conjunto ortonormal que genera el mismo subespacio que {x 0 , x v x 2 }. 

5. Sea V el espacio lineal de todas las funciones reales / continuas en [0, + co) y tales 
que la integral J^° e l i 2 (t)dt converge. Definamos (/, g) = Jjj° e ‘j(t)g(t)dt, y sea y 0 , y , 
y z , ..., el conjunto obtenido aplicando el método de Gram-Schmidt a x (ì , x v x 2 , ..., 
donde x„(t) = t’ para n > 0. Demostrar que y 0 (t) = 1, y^í) = t - 1, y 2 (í) = í 2 - 4t + 2, 
y,«) = f 3 - 9f 2 + 18t - 6. 

6. Èn el espacio lineal real C(l, 3) con producto interior (/, g) = Jj j(x)g(x)dx, sea 

/(Jf) = í/x y demostrar que el polinomio constante g más próximo a / es g = | log 3. 

Calcular llg — /|| 2 para este g. 

7. En el espacio lineal real C(0, 2) con producto interior (/, g) = J’j; j(x)g(x)dx, sea 

f(x) = e’ y demostrar que el polinomio constante g más próximo a / es g = J (e 2 — 1). 

Calcular ||g - /|| 2 para este g. 

8. En el espacio' lineal real C(—1, 1) con producto interior (/, g) =$-if(x)g(x)dx, sea 

f(x) = e’ y hallar el polinomio g más próximo a /. Calcular ||g — /||* para este g. 

9. En el espacio lineal real C(0, 2tr) con producto interior (/, g) = Jjj* f(x)g(x)dx, sea 
/U) = x. En el subespacio generado por u 0 (x) = 1, u^(x) = cosx, u 2 (x) = sen x, hallar 
el polinomio trigonométrico más próximo a /. 

10. En el espacio lineal V del ejercicio 5, poner f(x) = e~‘ y hallar el polinomio de primer 
grado más próximo a /. 
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TRANSFORMACIONES 
LINEALES Y MATRICES 


2.1 Transformaciones lineales 

Uno de los modernos objetivos del Análisis es un estudio amplio de funcio- 
nes cuyos dominios y recorridos son subconjuntos de espacios lineales. Tales fun- 
ciones se llaman transformaciones, aplicaciones, u operadores. Este capítulo trata 
de los ejemplos más sencillos, llamados transformaciones lineales, que se presen- 
tan en todas las ramas de la Matemática. Las propiedades de transformaciones 
más generales se obtienen a menudo aproximándolas mediante transformacio- 
nes lineales. 

Introducimos primero la notación y la terminología más corriente relativa a 
funciones cualesquiera. Sean V y W dos conjuntos. E1 símbolo 

T: V ->■ ÌV 

se usará para indicar que T es una función cuyo dominio es V y cuyos valores 
están en W. Para cada x de V, el elemento T(x) de W se llama imagen de x 
a través de T, y decimos que T aplica x en T(x). Si A es un subconjunto cual- 
quiera de V, el conjunto de todas Ias imágenes T(x) para x de A se llama la ima- 
gen de A a través de T y se representa por T(A). La imagen del dominio V, T(V), 
es el recorrido de T. 

Supongamos ahora que V y W son espacios lineales que tienen el mismo con- 
junto de escalares, y definamos una transformación lineal como sigue. 

definición. Si V y W son dos espacios lineales, una función T:V W se 
llama transformación lineal de V en W, si tiene las propiedades siguientes: 

a) T(x -)- y) = T(x) + T(y) cualesquiera que sean x e y de V, 

b) T(cx) = cT(x) para todo x de V y cualquier escalar c. 
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Esto significa que T conserva la adición y la multiplicación por escalares. 
Las dos propiedades pueden combinarse en una fórmula que establece que 

T(ax + by) = aT(x) + bT(ý) 

para todo x y todo y de V y todos los escalares a y b. Por inducción, tenemos 
también la relación más general 

T (,| a<X< ) =ì aiT{Xi) 

para n elementos cualesquiera x u ... ,x„ de V, y n escalares cualesquiera 
a lt ..., a„. 

E1 lector puede comprobar fácilmente que los ejemplos siguientes son trans- 
formaciones lineales. 

ejemplo 1. Transformación idéntica. La transformación T: V -* V, donde 
T(x) = x para todo x de V, se denomina transformación idéntica y se designa 
por / o por l v . 

ejemplo 2. Transformación cero. La transformación T:V -> V que aplica 
cada elemento de V en O se llama transformación cero y se designa por O. 

ejemplo 3. Multiplicación por un escalar fijo c. Tenemos aquí T:V -» V, 
donde T(x) = cx para todo x de V. Cuando c = 1, se trata de la transformación 
idéntica. Cuando c = 0, es la transformación cero. 

ejemplo 4. Ecuaciones lineales. Sean V = V„ y W = V m . Dados mn 
números reales con i = 1, 2, ..., m y k = 1 , 2 ,...,«, definamos T:V„ V m 
como sigue: T aplica cada vector x = fe,..., x„) de V n en el vector y = (y^, 
..., y m ) de V m de acuerdo con las ecuaciones 

y i = 'l a ik x k para i = 1, 2,. .., m . 

ejemplo 5. Producto interior con un elemento fijo. Sea V un espaeio real 
euclídeo. Para un elemento fìjo z de V, defìnamos T: V R así: Si x e V, 
T(x) = (x, z), el producto interior de x por z. 

ejemplo 6. Proyección sobre un subespacio. Sean V un espacio euclídeo 
ySun subespacio de V de dimensión finita. Definamos T:V -> S así: Si r e V, 
T(x) es la proyección de x sobre S. 
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ejemplo 7. El operador derivación. Sea V el espacio lineal de todas las 
funciones reales / derivables en un intervalo abierto (a, b). La transformación 
lineal que aplica cada función / de V en su derivada /' se llama operador deriva- 
ción y se designa por D. Así pues, tenemos D: V -* W, donde £)(/)=/' para cada 
/ de V. E1 espacio W contiene todas las derivadas /'. 

ejemplo 8. El operador integracion. Sea V el espacio lineal de todas las 
funciones reales continuas en un intervalo [a, fo]. Si / e V, defìnamos g = T(f) 
como la función V dada por 

g(x) = J o /(0 dt si a < x < o . 

Esta transformación T se llama operador integración. 


2.2. Núcleo y recorrido 

En esta sección, T representa una transformación lineal de un espacio lineal 
V en un espacio lineal W. 

teorema 2.1. El conjunto T(V) (recorrido de T) es un subespacio de W. 
Además, T aplica el elemento cero de V en el elemento céro de W. 

Demostración. Para demostrar que T(V) es un subespacio de W, tan sólo 
necesitamos comprobar los axiomas de clausura. Tomemos dos elementos cuales- 
quiera de T(V), sean T(x) y T(y). Entonces T(x) + T(y) = T(x + y), así que 
T(x) + T(y) pertenece a T(V). Asimismo, para cualquier escalar c tenemos 
cT(x) = T(cx), con lo que cT(x) pertenece a T(V). Por consiguiente, T(V) es un 
subespacio de W. Tomando c = 0 en la relación T(cx) = cT(x), encontramos que 
T(0) = O. 

definición. El conjunto de todos los elementos de V que T aplica en O se 
llama núcleo de T y se designa por N(T). Así pues, tenemos 

N(T) = {x \xeV y T(x) = 0}. 

teorema 2.2. El núcleo de T es un subespacio de V. 

Demostración. Si x e y están en N(T), lo mismo les ocurre a x + y y a cx 
para todos los escalares c, ya que 


T(x + y) = T(x) + T(ỳ) = O y T(cx) = cT(x) = O. 
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Los ejemplos que siguen describen los núcleos de las transformaciones linea- 
les dadas en la sección 2.1. 

ejemplo 1. Transformación idéntica. E1 núcleo es {O}, el subespacio 
constituido tan sólo por el elemento cero. 

ejemplo 2. Transformación cero. Puesto que todo elemento de V se aplica 
en cero, el núcleo es el mismo V. 

ejemplo 3. Multiplicación por un escalar fijo c. Si c ¥= 0, el núcleo sólo 
contiene el elemento O. Si c = 0, el núcleo es V. 

ejemplo 4. Ecuaciones lineales. E1 núcleo está constituido por todos los 
vectores (x,,. .., x„) de V„ para los cuales 

= 0 para i = 1, 2 ,. . . , m . 

ejemplo 5. Producto interior por un elemento fijo z. E1 núcleo consta 
de todos los elementos de V ortogonales a z. 

ejemplo 6. Proyección sobre un subespacio S. Si x e V, tenemos la 
única descomposición ortogonal x = s + s 1 - (según el teorema 1.15). Puesto que 
T(x) = s, tenemos T(x) = O si y sólo si x = s-k Por consiguiente, el núcleo es 
S-L, el complemento ortogonal de S. 

ejemplo 7. Operador derivación. E1 núcleo está formado por todas las 
funciones constantes en el intervalo dado. 

ejemplo 8 . Operador integración. E1 núcleo contiene solamente la fun- 
ción cero. 


2.3 Dimensión del núcleo y rango de la transformación 


También en esta sección T representa una transformación de un espacio lineal 
V en un espacio lineal W. Nos interesa la relación entre las dimensiones de V, del 
núcleo N(T) y del recorrido T(V). Si V es de dimensión finita, el núcleo también 
lo será por ser un subespacio de V. En el teorema que sigue, demostramos que 
el recorrido T(V) también es de dimensión finita; su dimensión se llama rango 
de T. 
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teorema 2.3. Si V es de dimensión finita, también lo es T(V), y tenemos 

(2.1) dim N(T ) + dim T(V) = dim V. 

Dicho de otro modo, la dimensión del núcleo más el rango de una transformación 
lineal es igual a la dimensión de su dominio. 

Demostración. Sean n = dim V y ...,e* una base para N(T), donde 

k = dim N(T) < n. Según el teorema 1.7; esos elementos forman parte de una ■ 
cierta base de V, por ejemplo de la base 

(2.2) e x ,..., e k , e k+1 ,. . ., e k+r , 


donde k + r = n. Demostraremos que los r elementos 
(2- 3 ) T(e k+1 ),..., T(e k+r ) 


forman una base de T(V), demostrando así que dim T(V)=r. Puesto que k+r=n, 
también eso demuestra (2.1). 

Demostramos primero que los r elementos de (2.3) generan T(V). Si 
y £ T(V), es y = T(x) para un cierto x de V, y podemos escribir x = c t e t + 
+ ... + Ck+#k+ r . Luego, tenemos 

y = = Ìi T ( e i) = 1 e iT(e t ) +^£ i C,T(e ( ) = ^ c t T(e t ) 

puesto que T(e t ) = ... =T(e k )= O. Esto demuestra que los elementos (2.3) 
generan T(V). 

Demostremos ahora que çsos elementos son independientes. Supongamos que 
existieran escalares c* +l ,..., c*+ r tales que 


fc-fr 

X c iT(e t ) = 0. 

i—k+l 


r ( ._Z c^ = O 


Esto implicaría que 
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por lo que el elemento x = Ck +1 ek+i + ... + c* + re* + r sería del núcleo N(T). Sig- 
nifica esto que existirían escalares c 1( ..., c* tales que x = c,e 3 + ... + cjtct, con 
lo que tendríamos 


k k+r 

x — x = 2 c t e t ' 2 c í e i — o ■ 

Pero como los elementos (2.2) son independientes, todos los escalares c, han de 
ser cero. Por consiguiente, los elementos (2.3) son independientes. 


Nota: Si V es de dimensión infinita por lo menos uno de los dos N(T) o T(V) es 
de dimensión infinita. En el ejercicio 30 de la Sección 2.4 se esboza una demostración 
de este hecho. 


2.4 Ejercicios 


En cada uno de los ejercicios del 1 al 10, se define una transformacion T:V 2 ->V 2 
mediante la fórmula dada para T(x, y), donde (x,y) es un punto cualquiera de V„. Deter- 


minar en cada caso si T es lineal. Si T es lit 
calcular sus dimensiones 

1. T(x,y)=(y,x). 

2. T(x,y) = (x, -y). 

3. T(x,y)=(x, 0). 

4. T(x,y) =(x,x). 

5. T(x,y) = (x\y 1 2 3 4 5 ). 


1, decir cuáles son el núcleo y el recorrido, y 


6. T(x,y)=(e*, e'% 

7. T(x,y) = (x, 1). 

8. T(x,y) =(x + 1 ,y + 1). 

9. T(x,y)=(x -y,x + y). 

10. T(x, y) = (2x - y, x + y). 


Hacer lo mismo en cada uno de los ejercicios del 11 al 15. Si la transformación 
T: V 2 —> V 2 es la que se indica. 

11. T hace girar cualquier punto el mismo ángulo <f> alrededor del origen. Esto es, T aplica 
un punto de coordenadas polares (r,6) en el punto de coordenadas polares (r, 6 + <f>), 
donde <f> es fijo. Además, T aplica O en sí mismo. 

12. T aplica cada punto en su simétrico respecto a una recta fija que pasa por el origen. 

13. T aplica todo punto en el punto (1, 1). 

14. T aplica cada punto de coordenadas polares (r, 6) en el punto de coordenadas (2 r,6). 
Además, T aplica O en sí mismo. 

15. T aplica cada punto de coordenadas polares (r, 0) en el punto de coordenadas (r, 28). 
Además, T aplica O en sí mismo. 


Hacer lo mismo en cada uno de los ejercicios 16 al 23 si la transformación T: V 3 —> V 3 
está defmida por la fórmula que se da para T(x, y, z), donde (x, y, z) es un punto arbitrario 
de V 3 . 


16. T(x, y, z) = (z,y,x). 

17. T(x, y, z) = (x,y, 0). 

18. T(x,y,z) = (x, 2y, 3z). 

19. T(x, y, z) =(x,y, 1). 


20. T(x,y, z) = (x + l,y + 1, z - 1). 

21. T(x, y, z) = (x + 1, y + 2, z + 3). 

22. T(x,y,z) =(x,y\z s ). 

23. T(x,y, z) =(x + z, 0, * + j). 
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En cada uno de los ejercicios del 24 al 27, la transformación T:V—>V es la que se 
indica. Determinar, en cada caso, si T es lineal. Si lo es, decir cuáles son el núcleo y el 
recorrido y calcular sus dimensiones cuando sean finitas. 

24. Sea V el espacio lineal de todos los polinomios reales p(x) de grado <, n. Si p e V, 
r q = T(p)| significa que q(x) = p(x + 1) para todo real x. 

25. Sea V el espacio lineal de todas las funciones reales derivables en el intervalo abierto 
( — 1,1). Si f e V, g = T(f) significa que g(x) = xf'(x) para todo x de ( — 1,1). 

26. Sea V el espacio lineal de todas las funciones reales continuas en [a,b]. Si feV, 
g = T(f) significa que 


g(x) = J*/(f) sen(jc - t) dt para a <, x <b. 


27. Sea V el espacio de todas las funciones reales derivables dos veces en un intervalo 
abierto (a, b). Si y 6 V, definir T(y) = y" + Py’ + Qy siendo P y Q dos constantes. 

28. Sea V el espacio lineal de todas las sucesiones reales convergentes {x„}. Definimos una 
transformación T:V-*V así: Si * = {*„} es una sucesión convergente con límite a, 
ponemos T(x) = {y„}, donde y„ = a — x„ para n > I. Demostrar que T es lineal y decir 
cuáles son el núcleo y el recorrido de T. 

29. Sea V el espacio lineal de todas las funciones continuas en el intervalo [ — n, n]. Sea S 
el subconjunto de V que consta de todas las funciones f que satisfacen las tres ecuaciones 


/_>) dt = 0, J^ f(t) cos t dt = 0, J^ f(t) sen t dt = 0 . 


a) Demostrar que S es un subespacio de V. 

b) Demostrar que S contiene las funciones f(x) = cos nx y f(x) = sen nx para cada 
n = 2, 3, ... 

c) Demostrar que S es de dimensión infinita. 

Sea T:V -*V la transformación lineal definida así: Si / e V, g = T(f) significa que 


g(x) = J^ {1 + cos (jc - /)}/(/) dt. 


30 . 


d) Demostrar que T(V), el recorrido de T, es de dimensión finita y hallar una base 
para T(V). 

e) Determinar el núcleo de T. 


todos ! os números reales y todas las funciones / no nulas de V tales que 
T(f) - cf. (Observese que una tal / pertenece al recorrido de T) 

V «’IT transformación ! ineal de un espacio lineal V en un espacio lineal 
„ , d ,. dlmens ' on ' nfmlta - demostrar que por lo menos uno de los dos T(V) 

o N(T) es de dtmenstón mfinita. 


[ Indicación : Supóngase dim N(T) = k, dim T(V) = r, sea e v .... e k una base 
para N(T) y sean ei, .... e k , e k+ i, ... e t+ „ elementos independientes de V, siendo 
n > r. Los elementos T(e t+ 1),..., T(e t ,„) son dependientes ya que n > r. Utilizar 
este hecho para obtener una contradicción.] 
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2.5 Operaciones algebraicas con transformaciones lineales 

Las funciones cuyos valores pertenecen a un espacio lineal dado W pueden 
sumarse unas con otras y pueden multiplicarse por escalares de W de acuerdo 
con la definición siguiente. 

definición. Sean S:V W y T:V W dos funciones con un dominio 
común V y con valores pertenecientes a un espacio lineal W. Si c es un escalar 
cualquiera de W, definimos la suma S + T y el producto cT por las ecuaciones 

(2-4) (S + T)(x) = S(x) + T(x) , (cT)(x) = cT(x) 

para todo x de V. 

Nos interesa especlalmente el caso en el que V es también un espacio lineal 
con los mismos escalares que W. En este caso designamos con Tf(V, W) el con- 
junto de todas las transformaciones lineales de V en W. 

Si S y T son dos transformaciones lineales de T£(V, W), es un sencillo ejerci- 
cio comprobar que S+T y cT también son transformaciones lineales de ST(V, W). 
Aún más. Con las operaciones que acabamos de definir, el mismo conjunto 
J?(V, W) se transforma en un nuevo espacio lineal. La transformación cero sirve 
de elemento cero en ese espacio, y la transformación (— 1 )T es la opuesta de T. 
Se comprueba que se satisfacen los diez axiomas de un espacio lineal. Por con- 
siguiente, tenemos el siguiente. 

teorema 2.4. El conjunto J£(V, W) de todas las transformaciones linea- 
les de V en W es un espacio lineal con las operaciones de adición y multiplica- 
ción por escalares definidas en (2.4). 

Una operación algebraica más interesante que se efectúa con las transfor- 
maciones lineales es la composición o multiplicación de transformaciones. Esta 
operación no utiliza la estructura algebraica de un espacio lineal y puede definirse 
con entera generalidad del siguiente modo. 

definición. Dados los conjuntos U, V, W. Sean T:U -> V una función con 
dominio U y valores en V, y S:V -> W otra función con dominio V y valores en 
W. La composición ST es la función ST:U -» W definida por 

(ST)(x) = Sjrfx)] para todo xenU. 

Así pues, para aplicar x mediante la composición ST, aplicamos primero x 
mediante T y luego aplicamos T(x) por medio de S. Esto se representa en la figu- 
ra 2.1. 
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Figura 2.1 Gráfico de la composición de dos transformaciones. 

La composición de funciones reales se ha encontrado repetidas veces en 
nuestro estudio del Cálculo, y hemos visto que la operación, en general, no es 
conmutativa. No obstante, como en el caso de las funciones reales, la composi- 
ción satisface la ley asociativa. 

TEOREMA 2.5. Si T:U -*■ V, S:V W, y R: W -> X son tres funciones, te- 
nemos 

R(ST) = (RS)T. 

Demostración. Las funciones R(ST) y ( RS)T tienen ambas dominio U y 
valores en X. Para cada x de U, tenemos 

(R(ST))(x) = R[(ST)(x)] = R[S[T(x)]\ y [(JW)7K*) = (JIS)[7X*)] = R(S(T(x)]], 
lo que demuestra que R(ST) = (RS)T. 

definición. Sea T:V V una función que aplica V en sí mismo. Defini- 
mos .inductivamente las potencias enteras de T como sigue: 

T° = /. T n = TT n l para n> I . 

Aquí / representa la transformación idéntica. E1 lector puede comprobar que 
la ley asociativa implica la ley de exponentes T m T n = T m+n para todos los ente- 
ros no negativos m y n. 

E1 teorema que sigue prueba que la composición de transformaciones lineales 
es lineal. 
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teorema 2.6. Si U, V, W son espacios lineales con los mismos escalares, 
y si T:U^V y S:V-»W son transformaciones lineales, la composición ST:U-*W 
es lineal. 

Demostración. Para todo x y todo y de U y todos los escalares a y b, te- 
nemos 

(ST)(ax + by) — S[T(ax + by)\ — S[aT(x) + bT(y)\ — aST(x) + bST(y). 

La composición puede combinarse con las operaciones algebraicas de adición 
y multiplicación por escalares en £P(V, W) llegando al siguiente 

teorema 2.7. Sean U, V, W espacios lineales con los mismos escalares, 
supongamos que S y T pertenecen a T£( V, W), y sea c un escalar cualquiera. 

a) Para cualquier función R con valores en V, tenemos 

(S + T)R = SR+TR y (cS)R = c(SR). 

b) Para cualquier transformación lineal R:W -* U, tenemos 

R(S +T)= RS + RT y R(cS) = c(RS). 

La demostración es una consecuencia inmediata de la definición de compo- 
sición y se deja como ejercicio. 


2.6 Inversas 

A1 estudiar las funciones reales aprendimos cómo construir nuevas funciones 
mediante la inversión de funciones monótonas. Queremos ahora extender el mé- 
todo de inversión a una clase más general de funciones. 

Dada una función T, nuestro objetivo es encontrar, si es posible, otra función 
S cuya composición con T sea la transformación idéntica. Puesto que la compo- 
sición, en general, no es conmutativa, tenemos que distinguir ST de TS. Por lo 
tanto introducimos dos tipos de inversas que llamamos inversa por la derecha e 
inversa por la izquierda. 

definición. Dados dos conjuntos V y W y una función T:V -» W. Se dice 
que una función S:T(V) V es inversa de T por la izquierda si S[T(a)] = x 
para todo x de V, esto es, si 

ST=Iy, 
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donde I v es la transformación idéntica sobre V. Una función R:T(V) -> V se 
llama inversa de T por la derecha si T[/?(y)] = y para todo y de T(V), esto es, si 

TR = I T { V ), 

donde Itiv> es la transformación idéntica sobre T(V). 

ejemplo. Una función sin inversa por la izquierda pero con dos inversas 
por la derecha. Sean V = {l,2}yff = {0}. Defmimos T:V W como sigue: 
T(l) = T(2) = 0. Esta función tiene dos inversas por la derecha R:W -» V y 
R':W -* V dadas por 


R( 0) = 1 , R\ 0) = 2 . 

No puede tener inversa por la izquierda S ya que ello exigiría 

1 = S[T(l)] = S( 0) y 2 = 5[T(2)] = 5(0). 

Este sencillo ejemplo pone de manifiesto que no tiene que existir necesariamente 
inversa por la izquierda y que la inversa por la derecha no tiene que ser necesa- 
riamente única. 

Toda función T:V W tiene por lo menos una inversa a la derecha. En efec- 
to, cada y de T(V) tiene la forma y = T(x) para al menos un x de V. Si elegimos 
uno de esos valores x y definimos R(y) = x, entonces T[T(y)] = T(x) = y para 
cada y de T(V), así que R es una inversa por la derecha. La no unicidad puede pre- 
sentarse debido a que puede haber más de un x de V que se aplique en un y de 
T(V). Dentro de poco demostraremos (teorema 2.9) que si cada y de T(V) es 
la imagen de un sólo x de V, la inversa por la derecha es única . 

Antes demostraremos que si existe inversa por la izquierda es única y, al mismo 
tiempo, es inversa a la derecha. 

teorema 2.8. Una T:V •* W puede tener a lo más una inversa por la 
izquierda. Si T tiene inversa por la izquierda S, entonces S es también inversa 
por la derecha. 

Demostración. Supongamos que T tenga dos inversas por la izquierda, 
S:T(V) -> V y S':T(V) -* V. Elijamos cualquier y en T(V). Demostraremos que 
S(y) = S'(y). Como y = T(x) para un cierto x de V, tenemos 


S[T(x)] = x y S’[T(x)] = x, 
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puesto que S y S' son ambas inversas por la izquierda. Por consiguiente S(y) = x 
y S'(y) = x, con lo que S(y) = S'(y) para todo y de T(V). Por lo tanto S = S' 
lo que demuestra que las inversas por la izquierda coinciden. 

Demostremos ahora que toda inversa por la izquierda S es también inversa 
por la derecha. Elijamos un elemento cualquiera y en T(V). Demostraremos que 
^[S(y)] = y. Puesto que y e T(V), tenemos y = T(x) para un cierto x de V. Pero 
S es inversa por la izquierda, así que 

x = S[r(*)] = S(j). 

Aplicando T, llegamos a T(x) = T[S(y)~\. Pero y = T(x), con lo que y = T[S(y)], 
lo cual completa la demostración. 

E1 teorema que sigue caracteriza todas las funciones que tienen inversa por 
la izquierda. 

teorema 2.9. Una función T:V -* W tiene inversa por la izquierda si y 
sólo si T aplica elementos distintos de V en elementos distintos de W; esto es, 
si y sólo si, para cualesquiera x e y de V, 

(2.5) x?iy implica T(x) * T(y). 

Nota: La condición (2.5) es equivalente a la afirmación 

(2.6) T(x) = T(y) implíca x =y. 

Una función T que satisface (2.5) o (2.6) para cualesquiera x e y de V se denomina 

Demostración. Supongamos que S es la inversa por la izquierda de T, y que 
T(x)=T(y). Queremos demostrar que x=y. Aplicando S, encontramos S[T(x)] = 
S[T(y)]. Puesto que S[T(x)] = x y S[T(y)] = y, esto implica x = y. Con ello 
queda demostrado que una función con inversa por la izquierda es uno a uno en 
su dominio. 

Demostremos ahora el recíproco. Supongamos que T es uno a uno en V. 
Encontraremos una función S:T(V) -> V que es inversa de T por la izquierda. 
Si y 6 T(V), entonces y = T(x) para un cierto x de V. En virtud de (2.6), exis- 
te exactamente un x en V para el cual y = T(x). Defmamos S(y) como ese x. Esto 
es, defmamos S en T(V) como sigue: 

S(ý) = x implica que T(x) = y . 

Tenemos entonces S[T(x)] = x para cada x de V, así que ST = I v . Por consi- 
guiente, la función S así defmida es inversa de T por la izquierda. 
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definición. Sea T:V -* W uno a uno en V. La única inversa de T por la 
izquierda (la cual sabemos que también es inversa por la derecha) se designa 
por T \ Decimos que T es invertible, y llamamos a T~ x la inversa de T. 

Los resultados de esta sección se refìeren a funciones cualesquiera. Seguida- 
mente aplicamos esas ideas a las transformaciones lineales. 


2.7 Transformaciones lineales uno a uno 

En esta sección, V y W representan espacios lineales con los mismos esca- 
lares, y T:V ~* W es una transformación lineal de &(V, W). La linealidad de T 
nos permite expresar de varias maneras la propiedad de que una transformación 
lineal sea uno a uno. 

teorema 2.10. Sea T:V ~* W una transformación lineal de Sl f(V, W). 
Son equivalentes las siguientes proposiciones. 

a) T es uno a uno en V. 

b) T es invertible y su inversa T~':T(V) -> V es lineal. 

c) Para todo x de V, T(x) = O implica x = O. Esto es, el núcleo N(T) con- 
tiene solamente el elemento cero de V. 

Demostración. Demostraremos que a) implica b), b) implica c), y c) impli- 
ca a). Supongamos primero que a) es cierta. T tiene entonces inversa (según el 
teorema 2.9), y tenemos que demostrar que T 1 es lineal. Tomemos dos elemen- 
tos cualesquiera u y v de T(V). Entonces u = T(x) y v = T(y) para algún x y 
algún y de V. Para dos escalares cualesquiera a y b, tenemos 

au + bv = aT(x) + bT(ỳ) = T(ax + by), 
ya que T es lineal. Luego, aplicando T _1 , tenemos 

T~\au + bv) = ax + by = aT~\u) + bT\v), 

así que T _1 es lineal. Por consiguiente a) implica b). 

Supongamos seguidamente que b) es cierta. Tomemos un x cualquiera de V 
para el cual T(x) = O. Aplicando T _1 , encontramos que x = T _, (0) = O, puesto 
que T _1 es lineal. Por consiguiente, b) implica c). 

Por último, supongamos cierta c). Tomemos dos elementos cualesquiera u 
y v de V siendo T(u)=T(v). Por la linealidad, tenemos T(u — v) = T(u)—T(v)= 
= O, así que u — v = O. Por consiguiente, T es uno a uno en V, y queda comple- 
tada la demostración del teorema. 
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Cuando V es de dimensión fìnita, la propiedad de ser uno a uno puede for- 
mularse en función de la dependencia y de ia dimensionalidad, como se indica 
en el teorema que sigue. 

teorema 2.11. Sea T:V W una transformación lineal de W) y 

supongamos que V es de dimensión finita, dim V = n. Entonces son equivalentes 
las proposiciones siguientes. 

a) T es uno a uno en V. 

b) Si e x ,, e p son elementos independientes de V, T(e t ),..., T(e p ) son 
elementos independientes de T(V). 

c) dim T(V) = n. 

d) Si {e t ,, e„} es una base para V, {T(e t ),..., T(e„)} es una base 
para T(V). 

Demostración. Probaremos que a) impiica b), b) implica c), c) implica d), 
y d) implica a). Supongamos que a) es cierta. Sean e t ,... ,e p elementos indepen- 
dientes de V y consideremos los elementos T(e t ),..., T(e p ) de T(V). Suponga- 
mos que 

2*7X0 = 0 

para ciertos escalares c lt ... ,c p . En virtud de la linealidad, obtenemos 

7^2«*) = 0 , y por tanto 2 c « e < = 0 

ya que T es uno a uno. Pero e t ,... ,e p son independientes, así que c, = .,. = 
c p = 0. Por consiguiente a) implica b). 

Supongamos ahora que es cierta b). Sea {e t ,..., e„} una base para V. Según 
b), los n elementos T(e t ),..., T(e„) de T(V) son independientes. Por consiguien- 
te, dim T(V) > n. Pero, según el teorema 2.3, tenemos dim T(V) < n. Luego 
dim T(V) = n, con lo cual b) implica c). 

Supongamos, seguidamente, que es cierta c) y sea {e t ,... ,e„} una base para 
V. Tomemos un elemento cualquiera y en T(V). Entonces y = T(x) para algún 
x en V, así que tenemos 

x = 2 c i e i > y p° r tanto y — t(x) = 2 c i T ( e ù ■ 

Por consiguiente { T(e t ),. .., T(e„)} genera T(V). Pero hemos supuesto que 
dim T(V) — n, así que {T(e t ),..., T(e„)} es una base para T(V). Por consi- 
guiente c) implica d). 
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Por último, supongamos cierta d). Demostraremos que T(x) = O implica 
x = O. Sea {e^,... ,e„} una base para V. Si x e V, podemos escribir 


x = ^ c&i , y por tanto 


T(x) = f Ci T(e t ) . 


Si T(x) = O, entonces c,=.. .= c„ = 0, puesto que los elementos T(e t ),..., T(e„) 
son independientes. Por lo tanto x = O, con lo cual T es uno a uno en V. Así 
pues, d) implica a) y el teorema queda demostrado. 

2.8 Ejercicios 


1. Sea V = {0,1}. Describir todas las funciones T:V —*V. En total son cuatro. Desíg- 
nense con T v T 2 , T 3 , T t y construir una tabla de multiplicación que muestre la com- 
posición de cada par. Inaicar cuáles son uno a uno en V y dar sus inversas. 

2. Sea V = {0, 1, 2}. Describir todas las funciones T:V-*V para las cuales T(V) = V. 
En total son seis. Desígnense con T v T 2 ,..,T e y construir una tabla de multiplicación 
que muestre la composición de cada par. Indicar cuáles son uno a uno en V, y dar sus 
inversas. 


En cada uno de los ejercicios del, 3 al 12, una función T:V 2 -» V 2 se define con la 
fórmula que se da pàra T(x,y), siendo (x,y) un punto cualquiera de V 2 . Determinar en 
cada caso si T es uno a uno en V 2 . Si es así, describir su recorrido T(V 2 ); para cada punto 
(u,v) de T(V 2 ), poner (x,y) = T _1 (h, v) y dar fórmulas para determinar teyen función 
de H y v. 


3. T(x,y)=(y,x). 

4. T(x,y) = (x, -y). 

5. T(x,y)=(x, 0). 

6. T(x,y) =(x,x). 

7. T(x,y) = (x 2 ,/). 


8. T(x,y) = (e*, e*). 

9. T(x,y)=(x, 1). 

10. T(x,y) =(x + 1 ,y + 1). 

11. T(x,y) =(x -y,x +y). 

12. T(x,y)=(2x -y,x + y). 


En cadá uno de los ejercicios del 13 al 20, se define una función T:V 3 ~>V 3 con la 
fórmula que se da para T(x,y,z), siendo (x,y,z) un punto cualquiera de V 3 . En cada caso, 
determinar si T es uno a uno en V 3 . Si es así, describir su recorrido T(V 3 ); para cada punto 
(u,v,w) de T(V 3 ), póngase (x,y,z) = T~Hu, v, w) y dar fórmulas para.la determinación de 
x, y, z en función de u, v, y w. 


13. T(x,y,z) = 

14. T(x,y,z) = 

15. T(x,y,z) = 

16. T(x,y,z) = 


(z,y,x). 

(x,y, 0). 

(x, 2y, 3z). 

(x,y,x + y + z). 


17. T(x,y, z) = (x + \,y + 1, z - 1). 

18. T(x, y, z) = (x + 1, y + 2, z + 3). 

19. T(x,y, z) = (x, x + y, x + y + z). 

20. T(x,y, z) = (x + y, y + z, x + z). 


21. Sea T:V—*V una función que aplica V en sí mismo. Por inducción se definen las 
potencias con las fórmulas T° = 1, T n = TT n ~ 1 para n> 1. .Demostrar que la ley 
asociativa para la composición implica la ley de exponente: T m T n = T m * n . Si T es in- 
vertible, demostrar que T” también es invertible y que (T n ) _1 = ( T 1 ) n . 
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En los ejercicios del 22 al 25, S y T representan funciones con dominio V y valores 
en V. En general ST * TS. Si ST = TS, decimos que S y T conmutan. 

22. Si S y T conmutan, demostrar que (ST)" = S n T n para cualquier entero n > U. 

23. Si S y T son invertibles, demostrar que ST también lo es y que (ST) _1 = T~ l S~\ Dicho 
de otro modo, la inversa de ST es la composición de las inversas, tomadas en orden 
inverso. 

24. Si S y T son invertibles y conmutan, demostrar que sus inversas también conmutan. 

25. Sea V un espacio lineal. Si S y T conmutan, demostrar que 

(S + Tf = S 2 + 2ST + T 2 y (S + T) 3 = S 3 + 3 S 3 T + 3 ST 2 + T 3 . 

Indicar cómo deben modificarse esas fórmulas si ST ^ TS. 

26. Sean S y T las transformaciones lineales de V 3 en V, definidas por las fórmulas 
S(x, y, z) = (z, y, x) y T(x, y, z) = (x,x + y, x + y + z), siendo (x, y, z) un punto cual- 
quiera de V 3 

a) Determinar la imagen de (x, y, z) a través de cada una de las transformaciones si- 

guientes: ST, TS, ST - TS, S 2 , T 2 , (ST) 2 , (TS) 2 , (ST - TS) 2 . 

b) Demostrar que S y T son uno a uno en V 3 y hallar la imagen de (u, v, w) a través 

de cada una de las transformaciones: S _1 , T~ l , (ST)~ l , (TS) -1 . 

c) Hallar la imagen de (x, y, z) a través de (T — I) n para cada n ^ 1. 

27. Sea V el espacio lineal de todos los polinomios reales p(x). Sean D el operador deriva- 
ción y T el operador integración que aplica cada polinomio p en un polinomio q dado 
por q(x) = p(t)dt. Demostrar que DT =/ F pero que TD ^ly. Describir el núcleo y 
el recorrido de TD. 

28. Sea V el espacio lineal de todos los polinomios reales p(x). Sean D el operador deri- 

vación y T la transformación lineal que aplica p(x) en xp'(x). 

a) Poner p(x) = 2 + 3x — x 2 + 4x s y determinar la imagen de p a través de cada una 

de las transformaciones siguientes: D, T, DT, TD, DT - TD, T 2 D 2 - D 2 T 2 . 

b) Determinar los polinomios p de V para los cuales T(p) = p. 

c) Determinar los polinomios p de V para los cuales (DT — 2 D)(p) = O. 

d) Determinar los polinomios p de V para los cuales (DT — TD) n (p) = D n (p). 

29. Sean V y D como en el ejercicio 28 pero T es la transformación lineal que aplica p(x) en 
xp(x). Demostrar que DT — TD = I y que DT n — T n D = nT » _1 para todo n > 2. 

30. Sean S y T dos transformaciones lineales de 3?(V, V) y supongamos que ST — TS = I. 
Demostrar que ST” - T n S = nT n_1 para todo n > 1. 

31. Sea V el espacio lineal de todos los polinomios p(x). Sean R, S, T funciones que apli- 
can un polinomio cualquiera p(x) = c 0 + cpc + .. .|+c„x" de Vjen los polinomios r(x), 
s(x) y t(x) respectivamente, siendo 


r(x) = p( 0), i(-r) = Ỳ 1 > 'M = 2 c *** +1 • 


a) Poner p(x) = 2 + 3x — x 2 + x 3 y determinar Ia imagen de p a través de cada una 
de las transformaciones siguientes: R, S, T, ST, TS, (TS) 2 , T 2 S 2 , S 2 T 2 , TRS, RST. 

b) Demostrar que R, S y T son lineales y determinar el núcleo y el recorrido de cada 

c) Demostrar que T es uno a uno en V y determinar su inversa. 

d) Sí n > 1, expresar (TS) n y S n T n en función de / y R. 

32. En relación con el ejercicio 28 de la Sección 2.4. Determinar si T es uno a uno en V. 
Si lo es, decir cuál es la inversa. 
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2.9 Transformaciones lineales con valores asignados 

Si V es de dimensión fìnita, siempre podemos construir una transformación 
lineal T:V -*• W con valores asignados a los elementos base de V, como se explica 
en el teorema siguiente. 

teorema 2.12. Sea e t ,,e„ una base para un espacio lineat n-dimen- 
sional V. Sean u -,,... ,u», n elementos arbitrarios de un espacio lineal W. Existe 
entonces una y sólo una transformación T:V -> W tal que 

(2.7) T(e k ) = u k para k = 1, 2,... , n. 

Esta transformación T aplica un elemento cualquiera x de V del modo siguiente: 
(2-8) Si x = 2 x k e k , entonces T(x) =]£x k u k . 

Demostración. Todo x de V puede expresarse en forma única como combi- 
nación lineal de e t .... ,e„, siendo los multiplicadores Xl ,... ,x„ los componen- 
tes de x respecto a la base ordenada (e,,..., e„). Si definimos T mediante (2.8), 
conviene comprobar que T es lineal. Si x = et para un cierto k, entonces todos 
los componentes de x son 0 excepto el fc-ésimo, que es 1, con lo que (2.8) da 
T(ek) = Uk, como queríamos. 

Para demostrar que sólo existe una transformación lineal que satisface (2.7), 
sea T' otra y calculemos T'(x). Encontramos que 


T’(x) = =Ìx k T'(e k ) = = T(x). 

Puesto que T’(x) = T(x) para todo x de V, tenemos T' = X, lo cual completa la 
demostración. 

ejemplo. Determinar la transformación lineal T: V 2 -> V 2 que aplique los 
elementos base i = (1,0) y j = (0, 1) del modo siguiente 

T(i) = i + j, T(j) = 2/ — j . 

Solución. Si x = Xyi -(- x 2 j es un elemento arbitrario de V 2 , entonces T(x) 
viene dado por 

T(x) = Xl T(ï) + x 2 T(j) = Xl (i + j) + x 2 (2 i - j) = ( Xl + 2 x 2 )i + ( Xl - x 2 )j. 
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2.10 Representación matricial de las transfonnaciones lineales 

E1 teorema 2.12 demuestra que una transformación lineal T:V -> W de un 
espacio lineal de dimensión finita V está determinada por su acción sobre un 
conjunto dado de elementos base e, ,,e„. Supongamos ahora que el espacio W 
también es de dimensión finita, por ejemplo dim W = m, y sea w, ,.. ., w„ una 
base para W. (Las dimensiones n y m pueden ser o no iguales.) Puesto que T 
tiene los valores en W, cada elemento T(eì) puede expresarse, con unicidad, como 
una combinación lineal de los elementos de la base u', ,. . ., w m , por ejemplo 


T (e k ) = lt ikWi , 

donde t lk ,..., t mk son los componentes de T(e k ) respecto a la base ordenada 
(u>!,..., w m ). Dispondremos verticalmente la m-pla (t lk ,..., t mk ), como a con- 
tinuación se indica: 


(2.9) 


'tvc 

tì k 


Esto se llama vector columna o matriz columna. Tenemos una tal columna para 
cada uno de los n elementos T(e j),..., T(e„). Colocándolas una junto a otra y 
encerrándolas en un par de corchetes obtenemos la disposición rectangular si- 
guiente: 

C:::::: :l 


Una t m2 ••• t m J 

Este cuadro se llama matriz y consta de m filas y n columnas. La llamamos matriz 
m X n. La primera fila es la matriz 1 X n (t ly , t 12 ,..., t,„). La matriz m X 1 
(2.9) es la fc-ésima columna. Los escalares U k van afectados con dos índices, el 
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primero i indica la fila y el segundo k indica la columna en las cuales aparece tik. 
A tik le llamamos el elemento ik de la matriz. También se utiliza la notación abre- 
viada 


(hk), o (hùT'Zi . 

para designar la matriz cuyo elemento ik es Uk. 

Así pues, toda transformación lineal T de un espacio n-dimensional V en un 
espacio /n-dimensional W da origen a una matriz m X n (f,*) cuyas columnas son 
los componentes de T(e ,),.... T(e„) relativos a la base (w, ,..., w m ). La lla- 

mamos representación matricial de T relativa a unas bases ordenadas (e,. e„) 

de V y (m/j ,..., w m ) para W. Una vez conocida la matriz (f;*), los componentes 
de un elemento cualquiera T(x) con relación a la base (u^ ,..., w m ) pueden deter- 
minarse como se explica en el teorema que sigue. 

teorema 2.13. Sea T una transformación lineal perteneciente a &(V, W), 
donde dim V = n y dim W = m. Sean (e,,..., e„) y (vv,,... ,w m ) bases orde- 
nadas de V y W, respectivamente, y (f,*) la matriz m X n cuyos elementos están 
determinados por las ecuaciones 

(2.11) T(e*) = ^ í i* w i - P ara k=í,2,...,n. 


Entonces un elemento cualquiera 


( 2 . 10 ) 




de V con componentes (x t ,..., x„) relativo a (e,,..., e„) es aplicado por T 
en el elemento 


(2.12) T(x) = fy iWi 

en W con componentes (y,,..., y m ) relativos a (iVi,..., w m ). Los y; están 
ligados a los componentes de x mediante las ecuaciones lineales 


(2.13) 


Ji =2'<*x* para i = l,2,...,m. 
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Demostración. Aplicando T a cada uno de los miembros de (2.11) y uti- 
lizandoj (2.10), obtenemos 


T(x) =fx k T(e k ) =Ìx k Ìy t = 1 (jU***) w * = 2 

en donde cada y, viene dada por (2.13). Esto completa la demostración. 

Habiendo elegido un par de bases (e x . e„) y (iVi ,. .. , w m ) para V y W, 

respectivamente, toda transformación lineal T:V W tiene una representación 
matricial (ta). Recíprocamente, si disponemos de mn escalares colocados formando 
una matriz rectangular (í f *) y elegimos un par de bases ordenadas para V y W, 
es fácil demostrar que existe exactamente una transformación lineal T:V W 
que tiene esa representación matricial. Defìnimos T simplemente con los elementos 
base de V por medio de las ecuaciones (2.10). Entonces, según el teorema 2.12, 
existe una y sólo una transformación T:V W con esos valores asignados. La ima- 
gen T(x) de un punto x de V viene entonces dada por las ecuaciones (2.12) y 
(2.13). 

ejemplo 1 . Construcción de una transformación lineal a partir de una ma - 
triz dada. Supongamos que disponemos de la matriz 2x3. 



Elijamos las bases usuales de vectores coordenados unitarios para V 3 y V 2 . En- 
tonces la matriz dada representa una transformación lineal T:V 3 ~*V 2 que aplica 
un vector cualquiera (x u x?, x a ) de V 3 en el vector (yi,y 2 ) de V 2 de acuerdo con 
las ecuaciones lineales 


Ji = + * 2 - 2x 3 

y 2 = x t + 0x 2 + 4x 3 . 

ejemplo 2. Construcción de una representación matricial de una transfor- 
mación lineal dada. Sea V el espacio lineal de todos los polinomios reales p(x) 
de grado < 3. Este espacio tiene dimensión 4, y elegimos la base (1, x, x*, x s ). 
Sea D el operador derivación que aplica cada polinomio p(x) de V en su deri- 
vada p'(x). Podemos considerar D como una transformación lineal de V en W, 
donde W es el espacio tri dimensional de todos los polinomios reales de grado < 2. 
En W elegimos la base (1,*, x 2 ). Para encontrar la representación matricial de D 
relativa a esa elección de bases, transformamos (derivamos) cada elemento base 
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de V y lo expresamos como una combinación lineal de los elementos base de W. 
Así pues, encontramos que 

D(l) = 0 = 0 + Ox + Ox 2 , D(x) = 1 = 1 + Ox + O* 2 , 

D(x 2 ) = 2x = 0 + 2x + 0x 2 , D(x*) = 3x 2 = 0 + Ox + 3x 2 . 

Los coeficientes de esos polinomios determinan las columnas de la representación 
matricial de D. Por consiguiente, la representación pedida viene dada por la si- 
guiente matriz 3X4. 


‘0 1 0 0' 

0 0 2 0 . 

0 0 0 3. 

Para hacer notar el hecho de que la representación matricial depende no sola- 
mente de los elementos base sino también de su orden, invirtamos el orden de los 
elementos base en W y utilicemos, en su lugar, la base ordenada (x 2 , x, 1). Enton- 
ces los elementos base de V se transforman en los mismos polinomios obtenidos 
antes, pero los componentes de éstos relativos a la nueva base (x 2 ,x, 1 ) aparecen 
en orden inverso. Por consiguiente, la representación matricial de D ahora es 

'0 0 0 3‘ 

0 0 2 0 . 

0 10 0 . 

Calculemos una tercera representación matricial de D, usando la base 
(1, 1 + x, 1 + x + x 2 , 1 + x + x 2 + x 3 ) para V, y la base (l,x, x 2 ) para W. 
Los elementos base de V se transforman así: 

D( 1) = 0, D(\ + x) = 1, D(l + x + x 2 ) = 1 + 2x , 

D( l+x + x 2 + ^)=l+2x + 3x 2 , 
con lo que la representación matricial en este caso es 

'0 1 1 r 
0 0 2 2 . 

0 0 0 3. 
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2.11 Construcción de una representación matricial en forma diagonal 

Ya que es posible obtener distintas representaciones matriciales de una trans- 
formación lineal dada mediante la elección de bases distintas, parece natural 
intentar elegir bases de modo que la matriz resultante tenga una forma lo más 
sencilla posible. E1 teorema que sigue prueba que podemos hacer todos los ele- 
mentos 0 excepto los de la diagonal que va desde el vértice superior izquierdo al 
inferior derecho. A lo largo de esa diagonal habrá una hilera de unos seguidos 
de ceros, siendo el número de unos igual al rango de la transformación. Una 
matriz (f,*) con todos los elementos tu. = 0 cuando i¥^ k se llama matriz dia- 
gonal. 

teorema 2.14. Sean V y W espacios lineales de dimensión finita, con 
dim V — n y dim W = m. Siupongamos que T e S£ (V, W) y que r = dim T(V) 
represente el rango de T. Existen entonces una base (e t ,, e„) para V y otra 
(iVi,..., w n ) para W tales que 


(2.14) 

T(e t ) = w t para i = 1,2 ,... ,r. 

y 


(2.15) 

T(ef) = O para i = r + l,..., 


Por consiguiente, la matriz (f,*) de T relativa a esas bases tiene todos los elementos 
cero excepto los r elementos de la diagonal que valen 

'n = t 2 2 = ■■■ = !„= 1. 

Demostración. Construimos primero una base para W. Puesto que T(V) 
es un subespacio de W con dim T(V) = r, el espacio T(V) tiene una base de r 
elementos en W, sean éstos w,,... ,w r . Según el teorema 1.7, esos elementos 
forman un subconjunto de una cierta base para W. Por consiguiente podemos ad- 
juntar unos elementos w r +, ,..., w m de modo que 

(2.16) (tfí.. 

sea una base para W. 

Seguidamente construimos una base para V. Cada uno de los r primeros 
elementos w t de (2.16) es la imagen por lo menos de un elemento de V. Elijamos 
uno de tales elementos de V y llamémosle ei. Entonces T(e,) = Wi para i = 1, 
2,.... r así que (2.14) se satisface. Sea ahora k la dimensión del núcleo N(T). 
Según el teorema 2.3 tenemos n = k + r. Puesto que N(T) = k, el espacio N(T) 
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tiene una base que consta de k elementos de V que designamos por e r+ì ,..., e r+ k. 
Para cada uno de esos elementos, la ecuación (2.15) se satisface. Por lo tanto, 
para completar Ia demostración, tenemos que demostrar que el conjunto ordenado 

(2.17) ( ei ,...,e r ,e r+1 ,...,e r+k ) 

es una base para V. Ya que dim V — n = r + k, sólo tenemos que demostrar 
que esos elementos son independientes. Supongamos que una cierta combinación 
lineal de ellos sea cero, por ejemplo 

(2.18) lV, = 0. 

Aplicando T y haciendo uso de Ias ecuaciones (2.14) y (2.15), encontramos que 

r+* t 

I c i T ( e i) = lw = o. 

Pero iVi,..., w r son independientes, y por tanto c x = ... = c r = 0. Por consi- 
guiente, los r primeros términos de (2.18) son cero, por lo cual (2.18) se re- 
duce a 


2 c i e i = o. 

Pero e r+1 ...., e r+ k son independientes puesto que forman una base para N(T), 
y por tanto c r+1 = ... ='c r+ k= 0. Por consiguiente, todos los c, de (2.18) son 
cero, luego los elementos de (2.17) forman una base para V. Esto completa la 
demostración. 

ejemplo. Nos referimos al ejemplo 2 de la sección 2.10, donde D es el 
operador derivación que aplica el espacio V de los polinomios de grado < 3 
en el espacio W de los polinomios de grado < 2. En este ejemplo, el recorrido 
T(V ) = W, así que T tiene rango 3. Aplicando el método seguido en el teorema 
2.14, elegimos cualquier base para W, por ejemplo la base (í,x, x 2 ). Un con- 
junto de polinomios de V que se aplica sobre esos elementos es (x, {x l , ^ 3 ). 
Ampliamos este conjunto para lograr una base para V adjuntando el polinomio 
constante 1, que es una base para el núcleo de D. Por consiguiente, si empleamos 
la base (x, {x 2 , {x 3 , I) para V y la base (1, *, x 2 ) para W, la correspondiente 
representación matricial para D tiene la forma diagonal 

"1 0 0 0 ' 

0 10 0 . 

0 0 1 0 
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2.12 Ejercicios 

En todos los ejercicios en los que se considere el espacio vectorial V„, la base que se 
utilizará será la de los vectores coordenados unitarios si no se dice lo contrario. En los ejer- 
cicios relativos a la matriz de una transformación lineal T: V —> W siendo V = TV, si no se 
indica lo contrario tomaremos la misma base en V y en IV. 

1. Determinar la matriz de cada una de las siguientes transformaciones lineales de V„ en V„: 

a) la transformación idéntica, 

b) la transformación cero, 

c) multiplicación por un escalar fijo c. 

2. Determinar la matriz para cada una de las siguientes proyecciones. 

a) T: V 3 ->- V 2 , donde T(x x , x 2 , x 3 ) = , x s ). 

b) T: V 3 ^V 2 , donde T( Xl , x 2 , x 3 ) = (x 2 , x 3 ). 

c) T: V b -*V 3 , donde T(x x , x 2 , x 3 , x á , x 5 ) = (x 2 , x 3 , jc 4 ). 

3. Una transformación lineal T: V 2 —> V 2 aplica los vectores base / y j como sigue: 

m-i+j, T(j) = 2/ — j. 

a) Calcular T(3i — 4 j) y T 2 (3/ — 4j) en función de i y j. 

b) Determinar la matriz de T y de T 2 . 

c) Resolver la parte b) si la base (ij) se reemplaza por (e v e 2 ), siendo e y = i - j, e 2 

= 3/ +j. 

4. Una transformación lineal T:V t ~> V 2 se define así: Cada vector (x,y) se transforma en 
su simétrico respecto al eje y y luego se duplica su longitud para obtener T(x, y). De- 
terminar la matriz de T y la de T*. 

5. Sea T: V 3 —> V 3 una transformación lineal tal que 

T(k) = 2i + 3j + 5k , T(j + k)=i, T(i + j + k) = j - k . 

a) Calcular T(i + 2j -(- 3A)y determinar la dimensión del núcleo y el rango de T. 

b) Determinar la matriz de T. 

6. Para la transformación lineal del ejercicio 5, se consideran las dos bases coincidentes 
c°n (e v e 2 , e s ), siendo ei = (2, 3, 5), e 2 = (1, 0, 0), e 3 = (0, 1, -1) y determinar la 
matriz T relativa a las nuevas bases. 

7. Una transformación lineal T: V., —> V, aplica los vectores base como sigue- T(i) = (0 0) 
T(j)=(l, 1), T(k) = (í, —1). 

a) Calcular T(4i — j + k) y determinar la dimensión del núcleo y el rango de T. 

b) Determinar la matriz de T. 

c) Utilizando la base (i,j, k) en V, y la (w,, w 2 ) en V 2 , siendo u’i = (1,1), w = (1,2), 
determinar la matriz de T relativa a esas bases. 

d) Hallar las bases (e v e 2 , e 3 ) para V 3 y (u>i, iv 2 ) para V 2 para las cuales la matriz de 
T tenga la forma diagonal. 

8. Una transformación lineal T:V —> V, aplica los vectores base como sisue- T(i) = 

(1, 0, 1), T0') = (-1, 0, 1). W 

a) Calcular T(2« — 3j)y determinar la dimensión del núcleo y el rango de T. 

b) Determinar la matriz de T. 

c) Hallar bases (e, , e 2 ) para V 2 y (w,. w 2 , w. 3 ) para V 3 para las cuales la matriz de T 
tiene forma diagonal. 

9. Resolver el ejercicio 8 si T(/)=(l, 0, 1) y T(j) = (1, 1, 1). 
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10. Sean V y W dos espacios lineales, ambos de dimensión 2 y con la misma base (e T , e 2 ). 
Sea T:V W una- transformación lineal tal que 

T(e y + e 2 ) = 3e x + 9e 2 , T(3 ei + 2e 2 ) = 7 ei + 23e 2 . 

a) Calcular T(e 2 — e x ) y determinar la dimensión del núcleo y el rango de T. 

b) Determinar la matriz de T relativa a la base dada. 

c) Utilizar para V la base (e lt e 2 ) y hallar una nueva base de la forma (e, + ae 2 , 
2e + be 2 ) para W, para la que la matriz de T tenga la forma diagonal. 

En el espacio lineal de todas las funciones reales, cada uno de los siguientes conjuntos 
es independiente y genera un subespacio V de dimensión fìnita. Utilizar el conjunto dado 
como base para V y sea D:V—>V el operador derivación. En cada caso, hallar la matriz 
de D y la de D 2 relativa a la base que se elige. 

11. (senx, cos at). 15. (— cos x, sen x). 

12. (1,*, e x ). 16. (senx, cos x, x sen x, x cos x). 

13. (1,1 + x,l + x + e x ). 17. (e x sen *, é* cos x). 

14. (e x , xe*). 18. (e 2 *sen 3x, e 2 * cos 3x). 

19. Elegir ía base (1, x, x 2 , x a ) en el espacio lineal V de todos los polinomios reales de 
grado <3. Sean D el operador derivación y T:V—>V la transformación lineal que 
aplica p(x) en xp'(x). Con relación a la base dada, determinar la matriz de cada una 
de las transformaciones siguientes: a) T; b) DT; c) TD; d) TD — DT; e) T 2 ; 
f) T 2 D 2 - D 2 T 2 . 

20. Con respecto al>ejercicio 19. Sea IV la imagen de V a través de TD. Hallar bases para 
V y IV para las que la matriz TD tenga forma diagonal. 


2.13 Espacios lineales de matrices 

Hemos visto cómo las matrices se presentan espontáneamente como represen- 
taciones de las transformaciones lineales. También se pueden considerar las ma- 
trices como elementos existentes con independencia de las transformaciones linea- 
les. Como tales elementos, forman otra clase de objetos matemáticos que pueden 
definirse por medio de las operaciones algebraicas que pueden realizarse con ellos. 
La relación con las transformaciones lineales da origen a esas definiciones, pero 
tal relación será por el momento ignorada. 

Sean m y n dos enteros positivos y sea I m „ el conjunto de todos los pares de 
enteros (i, j) tales que 1 < i < m, 1 < j < n. Cualquier función A cuyo dominio 
sea Imjt se denomina matriz m X n. E1 valor de la función A(i, j) se llama elemen- 
to ij de la matriz y se designará también por a,,-. Ordinariamente se disponen 
todos los valores de la función en un rectángulo que consta de m filas y n co- 
lumnas, del modo siguiente 
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Los elementos a,j pueden ser objetos arbitrarios de naturaléza cualquiera. Normal- 
mente serán números reales o complejos, pero a veces conviene considerar matrices 
cuyos elementos son otros objetos, por ejemplo, funciones. También designaremos 
las matrices mediante la notación abreviada 

A = ( a ìj)™ih o A = (a fj ) . 

Si m — n, la matriz se llama cuadrada. Una matriz 1 X n se llama matriz fila; 
una matriz m X 1 es una matriz columna. 

Dos funciones son iguales si y sólo si tienen el mismo dominio y toman los 
mismos valores en cada elemento del dominio. Puesto que las matrices son fun- 
ciones, dos matrices A = (a,,) y B = (&,-,) son iguales si y sólo si tienen el mismo 
número de filas, el mismo número de columnas, e iguales elementos a,, = b,j para 
cada par (ï, /), 

Supongamos ahora que los elementos son números (reales o complejos) y 
defmamos la adición de matrices y la multiplicación por escalares siguiendo el 
mismo método que para funciones reales o complejas cualesquiera. 

definición. Si A = (a,/) y B = (&,,) son dos matrices m X n y si c es un 
escalar cualquiera, definimos las matrices A + B y cA del modo siguiente 

A + B = (a„ + bjj), cA = (ca tí ) . 

La suma sólo se define cuando A y B tienen el mismo tamano m X n. 

EJEMPLO. Si 



Definimos la matriz O como la matriz m X n cuyos elementos son todos 0. 
Con esas definiciones, es inmediato el ejercicio de comprobar que el conjunto de 
todas las matrices m X n es un espacio lineal. Lo designamos con M m ,„. Si los ele- 
mentos son números reales, el espacio M m ,„ es un espacio lineal real. Si son nú- 
meros complejos, M m „ es un espacio lineal complejo. Es también fácil demostrar 



Isomorfismo entre transformaciones lineales y matrices 


65 


que este espacio es de dimensión m X n. En efecto, una base para M m ,„ consta 
de mn matrices que tienen un elemento igual a 1 y todos los demás iguales a 0. 
Por ejemplo, las seis matrices 

ri oon ro ì 0] ro o n ro o 01 ro o 01 ro o 01 

1_0 o oj ’ |_o 0 Oj ’ Lo 0 oj’ L 1 0 Oj’ L° 1 oj’ L° 0 ij ’ 

forman una base para el conjunto de todas las matrices 2X3. 


2.14 Isomorfismo entre transformaciones lineales y matrices 


Volvamos ahora a la relación entre matrices y transformaciones lineales. 
Sean V y IV dos espacios Iineales de dimensión finita con dimV=« y dim W=m. 
Elijamos una base (ei,..., e„) para V y otra (wi,..., w m ) para VV. En esta 
discusión esas bases se mantienen fijas. Designemoscon ££(V, IV) el espacio lineal 
de todas las transformaciones lineales de V en IV. Si Te\J£(V,W), sea m(T) la 
matriz de T relativa a las bases dadas. Recordemos que m(T) se define como sigue. 

La imagen de cada elemento base eu se expresa como una combinación lineal 
de los elementos base de IV: 

(2-19) T(e k ) = ^ t ik Wf para k = 1,2,...,«. 

Los multiplicadores escalares Uk son los elementos ik de m(T). Así pues, tenemos 

(2-2°) m(T) = (t ik )™’2i. 

La ecuación (2.20) define una nueva función m cuyo dominio es T£( V, W) y 
cuyos valores son matrices de M m ,„. Puesto que toda matriz m X n es la matriz 
m(T) para una cierta T de T£(V, W), el recorrido de m es M m ,„. E1 teorema si- 
guiente prueba que la transformación m: S£(V, W) -*■ M m ,„ es lineal y uno a uno 
en ££(V, W). 


teorema 2.15. teorema de isomorfismo. Para cualesquiera S y T de 
££(V, W) y todos los escalares c, tenemos 

m(S + T) = m(S) + m(T) y m(cT) = cm(T) . 

Además, 

m(S) = m(T) implica S = T, 
así que m es uno a uno en ££(V, W). 
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Demostración. La matriz m(T ) está formada con los factores tik de (2.19). 
Del mismo modo, la matriz m(S) está constituida con los factores sa de las ecua- 
ciones 

(2.21) S(e k ) = 2 s ik w { para k = 1, 2,. .., n . 

Puesto que tenemos 

(S + T)(e k ) = f(s ik + t ik ) Wi y (cT)(e k ) = f(ct ik ) Wi , 

obtenemos m(S 4- T) = (s ik + t ik ) = m(S) + m(T) y m(cT) = (ct ik ) = cm(T). 
Esto demuestra que m es lineal. 

Para demostrar que m es uno a uno, supongamos que m(S) = m(T), siendo 
S = (s ik ) y T = (í,t). Las ecuaciones (2.19) y (2.21) demuestran que S(e k ) = 
= T(e k ) para cada elemento base e k , así que S(x) = T(x) para todo x de V, y por 
tanto S = T. 

Observación: La función m es un isomorfismo. Elegidas unas bases, m establece 
una correspondencia uno a uno entre el conjunto de las transformaciones <£ (V,W) y 
el conjunto M„.„ de las matrices m X n. Las operaciones de adición y multiplicación por 
escalares se conservan a través de esa correspondencia. Los espacios lineales íf (V, W) 
y Mm* se dice que son isomorfos lncidentalmente, el teorema 2.11 demuestra que el 
dominio de una transformación lineal uno a uno tiene la dimensión igual a su recorrido. 
Por consiguiente, dim-S^V, W) — dim M„.„ — mn. 

Si V = W y elegimos la misma base para ambos, la matriz m(I) correspon- 
diente a la transformación idéntica /: V -* V es una matriz diagonal con los ele- 
mentos de la diagonal iguales a 1 y todos los demás iguales a 0. Esta se llama 
identidad o matriz unidad y se designa con / o con I„. 


2.15 Multiplicación de matrices 

Algunas transformaciones lineales pueden multiplicarse por medio de la com- 
posición. Defìniremos ahora la multiplicación de matrices de manera que el pro- 
ducto de dos matrices corresponda a la composición de las transformaciones linea- 
les que ellos representan. 

Recordemos que si T:U -* V y S'-V -* W son transformaciones lineales, su 
composición ST:U W es una transformación lineal dada por 

ST(x) = 5[T(x)] para todo x de U. 

Supongamos que U,V,yW son de dimensión finita, por ejemplo 
dim U = n, dim V = p, dim W = m. 
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Elijamos bases para U, V, y W. Con relación a esas bases m(S) es una matriz 
m X p, T es una matriz p X n , y ST es una matriz m X n . La si- 
guiente definición de multiplicación de matrices nos permite deducir la relación 
m(ST) = m(S)m(T). Esto extiende a los productos la propiedad de isomorfismo. 


definición. Sean A una matriz m X p çualquiera, y B una matriz p X n 
cualquiera, tales como 

a = y * = (&«)•£ i- 

El producto AB se define como la matriz m x n, C=(Cij), cuyo elemento ij viene 
dado por 


( 2 . 22 ) 


i = I a i* b 


ki • 


Observación: E1 producto AB sólo está definido si el número de columnas de 
A es igual ai de filas de B. 


Si escribimos A, para expresar la fila i de A y B 1 para la columna 
j de B, y las imaginamos como vectores de dimensión p, la suma (2.22) es sim- 
plemente el producto escalar Ai • B’. Es decir, el elemento ij de AB es el producto 
escalar de la fila i de A por la columna j de B: 

AB = (A t ■ BXjh ■ 

Así pues, la multiplicación de matrices puede considerarse como una generaliza- 
ción del producto escalar. 


ejemplo 1. 




f 4 61 

r 3 i 

1 2 i 


= 

y b = 


L-i i 

i oj | 

[o 2 _ 


Puesto que A es 2 X 3 


y B es 3 X 2, el producto AB es la matriz 2X2 


AB = 


'A^-B 1 A^-B*! T17 21' 

A 2 B 1 A 2 ■ B 2 \ ~ l 1 — 7_ ' 


Los elementos de AB se calculan así 

A^B 1 ^ 3-4 + 1-5 + 2-0 = 17, A, • B 2 = 3 • 6 + 1 • (-1) + 2 • 2 = 21 , 
A^-B 1 = (—1) - 4 + 1 - 5 + 0-0 = 1, + 2 -fi 2 = (-l)-6 + 1 ■(-!) +0-2 = -7. 
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ejemplo 2. Sea 


'2 1 

1 2 


Aquí Aes2X3yfies3X 1, con lo que AB es la matriz 2X1 dada por 
r-91 


Puesto que A, • B 1 = 2 • (-2) + 1-1+ (-3) • 2 = -9 y A a • B 1 = 1 • (-2) + 
+ 2 • 1 + 4 • 2 = 8. 


ejemplo 3. Si A y B son dos matrices cuadradas del mismo tamaiio, enton- 
ces AB y BA están definidas. Por ejemplo, si 



encontramos que 



Este ejemplo prueba que en general 
son permuiables o que conmutan. 



¥ BA. Si AB = BA, decimos que A y B 


ejemplo 4. Si / p es la matriz identidad p X p.entonces 1 P A = A para toda 
matriz A, p X n, y BI P = B para toda matriz B,m X p. Por ejemplo: 


'1 0 0 ' 
0 1 0 
0 0 1 



Demostramos seguidamente que la matriz de una composición ST es el pro- 
ducto de las matrices m(S) y m(T). 
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teorema 2.16. Sean T:U -* V y S:V W dos transformaciones lineales, 
donde U, V, W son espacios lineales de dimensión finita. Entonces, elegidas unas 
bases fijas, las matrices de S, T y ST están relacionadas por la ecuación 

m{ST) = m{S)m{T). 

Demostración. Supongamos que dim U = n, dim V = p, dim W = m. Sean 
u„) una base para U,{v l3 ..v P ) una base para V, y (iVj,..., w m ) una 
base para W. Con relación a esas bases tenemos 

m{S) = {Sfff^Zi, donde S{v k ) = jr s it w, para k = 1, 2, . . ., p, 

y 

m (T) = (hiìi.'jLi, donde T(m ; ) = %t kj v k para 7 = 1,2.n . 

ifc=r 

Por consiguiente, tenemos 

ST{Uj) = S[T{Uj)] =ít ki S(v k ) =ít kj fs ikWt = | (Ìs i)fc í w )w,., 
con ello encontramos que 

m(ST) = = m (S)m(T). 

Ya hemos observado que la multiplicación de matrices no siempre satisface 
la ley conmutativa. E1 teorema siguiente prueba que satisface las leyes asociativa 
y distributiva. 

TEOREMA 2.17. LEYES ASOCIATIVA Y DISTRIBUTIVA PARA LA MULTIPLICA- 
ción de matrices. Dadas las matrices A, B, C. 

a) Si los productos A(BC) y ( AB)C tienen sentido, tenemos 

A(BC) = ( AB)C (ley asociativa). 

b) Supongamos que A y B sean del mismo tamafio. Si AC y BC tienen sen- 
tido, tenemos 

(A + B)C = AC + BC (ley distributiva por la derecha), 
en tanto que si CA y CB tienen sentido, tenemos 

C(A + B) = CA + CB (ley distributiva por la izquierda). 






70 


Transjormaciones lineales y matrices 


Demostración. Esas propiedades pueden deducirse direçtamente a partir de 
la definición de multiplicación de matrices, pero preferimos razonar del siguiente 
modo. Introduzcamos los espacios lineales de dimensión finita U, V, W, X y las 
transformaciones lineales T:U -> V, S:V -> W, R:W -> X tales que fijadas unas 
bases, tenemos 


A = m(R), B = m(S), C = m(T) . 

Según el teorema 2,16, es m(RS) = AB y m(ST) = BC. De la ley asoeiativa 
para la composición, encontramos que R(ST) = (RS)T, Aplicando el teorema 
2 16 una vez más a esa ecuación, obtenemos m(R)m(ST) = m(RS)m(T) o 
A(BC) = (AB)C, que demuestra a). La demostración de b) puede hacerse con 
un razonamiento parecido. 

definición. Si A es una matriz cuadrada, definimos \a potencia entera de 
A por inducción como sigue: 

A° = I, A^^AA”- 1 paran^l, 


2.16 Ejercicios' 


' 1 X 

B= -1 3 , C = 

5 “2 

BA, AC, CA, A(2B - 3Q. 

r° n 

2. Sea A = I I . Hallar todas las matrices B, 2 X 2, tales que a) AB = O; b) BA = O. 

3. Hallar en cada caso a, h, c, d para que se satisfaga la ecuación dada. 


t -3* 


2 2 
1 -1 
1 -3 


calcular B + C, AB, 


"0 0 1 0‘ 

~a 


T 


'1 0 2 0' 

10 0 0 

b 


9 

; b) r° * c 

0 0 11 

0 10 0 

c 


6 

Ll 4 9 2j 

0 10 0 

0 0 0 1 _ 

d_ 


.5. 


,0 0 1 0 . 
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4. Calcular en cada caso AB — BA. 


a) A 


b) A 


'1 2 2' 

2 12 , 
_1 2 3 
‘ 2 0 

1 1 

-1 2 


' 411 ' 

= -4 2 0; 

1 2 i_ 

0] r 3 1 ~ 2 

2 , 5= 3-2 4 . 

lj L-3 5 11. 


5. Si A es una matriz cuadrada, demostrar que A n A m = A n+m para todos los enteros 
m > 0, n > 0. 


6. Sea ^ = [q ‘J 

fcos 6 

7. Sea A = 

l_sen0 


. Comprobar que A 2 = 


C 3 


y calcular A n . 


. Comprobar que A 2 = 


Tcos 26 
l_sen 26 


—sen291 
cos 28\ 


y calcular A n . 


8. Sea A = 

i i r 

0 1 1 

. Comprobar que A 2 = 

'1 2 3' 

0 1 2 


_0 0 1 


.0 o 1_ 


■ Calcular A 3 y A*. Suponer 


una fórmula general para A” y demostrarla por inducción. 

r i oi 

9. Sea /4=1 ^ I. Demostrar que A 2 = 2A — I y calcular A 100 . 

10. Hallar todas las matrices A, 2x2, tales que A 2 = O. 

11. a) Probar que una matriz A, 2 X 2, conmuta con cualquier matriz 2 X 2 si y sólo si 
A conmuta con cada una de las cuatro matrices 

ca- [::]• n n- 

b) Hallar todas esas matrices A. 

12. La ecuación A 2 = / se satisface para cada una de las matrices 2x2 

P' C-j [i-:]' 
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donde b y c son números reales arbitrarios. Hallar todas las matrices A, 2 X 2, tales 
que A 2 = I. 

13. Si A = [" 1 y B =1 T 1 , hailar matrices C y D, 2 x 2, tales que 

L-2 3j 1 L9 8j 

AC =B y DA = B. 


14. a) Comprobar que las identidades algebraicas 


(A + Bf = A* + 2AB + B 2 y 


no son ciertas para las matrices 2x2 , A = 


b) Modificar el segundo miembro de esas identidades para obtener fórmulas válidas 
para todas las matrices cuadradas A y B. 

c) iPara qué matrices A y B son válidas las identidades establecidas en a)? 


(+ + B)(A — B) = A 2 — B 2 



2.17 Sistemas de ecuaciones lineales 

Sea A = (an) una matriz «Xnde números dada, y sean c x ,,c m otros 
m números. Un conjunto de m ecuaciones de la forma 

(2.23) % a ik x k = c i P ara i = 1,2,..., m, 

1 

se llama sistema de m ecuaciones lineales con n incógnitas. Consideramos 
X) ,... ,x„ como incógnitas. Una solución del sistema es una n-pla cualquiera de 
números (x,, ..., x„) para los que se satisfacen todas las ecuaciones. La matriz A 
se llama matriz de los coeficientes del sistema. 

Los sistemas lineales pueden estudiarse por medio de las transformaciones 
lineales. Elegimos las bases usuales de vectores coordenados unitarios en V„ y V m . 
La matriz de los coeficientes A determina una transformación lineal, T: V„ -» V m , 
que aplica un vector arbitrario x = (x, ,..., x„) de V„ en el vector y = (y,,..., 
y m ) de V m dado por las ecuaciones lineales 


.L = 'S,a a Xk P ara ‘ = l, 2,..., m . 
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Sea c = (Cj ,,c m ) el vector de V m cuyos componentes son los números que 
aparecen en el sistema (2.23). Este sistema puede escribirse más sencillamente 
poniendo 


T(x) = c . 

E1 sistema tiene una solución si y sólo si c está en el recorrido de T. Si un solo 
x de V n se aplica en c, el sistema tiene una sola solución. Si más de un x se 
aplica en c, el sistema admite más de una solución. 

ejemplo 1. Un sistema sin solución. E1 sistema * + y = 1, x + y = 2 
no tiene solución. La suma de dos números no puede ser a la vez 1 y 2. 

ejemplo 2. Un sistema con solución única. E1 sistema x + y = 1, 
x — y = 0 tiene exactamente una solución: (x, y) = d, è). 

ejemplo 3. Un sistema con más de una solución. E1 sistema x + y = 1, 
que consta de una ecuación con dos incógnitas, tiene más de una solución. Dos 
números cualesquiera cuya suma sèa 1 dan una solución. 

A cada sistema lineal (2.23), podemos asociar otro sistema 
2 a ik*k = 0 para i = 1 , 2 , . .., m , 

obtenido reemplazando cada c/ en (2.23) por 0. Éste se llama el sistema homo- 
géneo correspondiente al (2.23). Si c^O, el sistema (2.23) se llama no ho- 
mogéneo. Un vector x de V„ satisfará el sistema homogéneo si y sólo si 

T(x) = O , 

donde T es la transformación lineal determinada por la matriz de los coeficientes. 
E1 sistema homogéneo tiene siempre la solución x = O, pero puede tener otras. 
E1 conjunto de soluciones del sistema homogéneo es el núcleo de T. E1 teorema 
siguiente expone la relación entre las soluciones del sistema homogéneo y las del 
sistema no homogéneo. 

teorema 2.18. Supongamos que el sistema no homogéneo (2.23) tenga 
una solución, por ejemplo b. 

a) Si un vector x es una solución del sistema no homogéneo, entonces el 
vector v = x — b es una solución del correspondiente sistema homo- 
géneo. 
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b) Si un vector v es una solución del sistema homogéneo, el vector x=v + b 
es una solución del sistema no homogéneo. 

Demostración. Sea T:V„ —* V m la transformación lineal determinada por la 
matriz de los coeficientes, como antes se ha dicho. Puesto que b es una solución 
del sistema no homogéneo tenemos T(b) = c. Sean x y v dos vectores de V„ tales 
que v = x — b. Entonces tenemos 

T(v) = T(x -b) = T(x) - T(t) = T(x) - c 
Por consiguiente T(x) = c si y sólo si T(v) = O. Esto demuestra a la vez a) y b). 

Este teorema prueba que el problema de hallar todas las soluciones de un 
sistema no homogéneo se escinde en dos partes: 1) Hallar todas las soluciones 
v del sistema homogéneo, esto es, determinando el núcleo de T; y 2) hallar una 
solución particular b del sistema no homogéneo. Sumando b a cada uno de los 
vectores v del núcleo T, se obtienen todas las soluciones x = v + b del sistema 
no homogéneo. 

Sea k la dimensión de N(T). Si podemos encontrar k soluciones independien- 
tes v\ ,... ,v k del sistema homogéneo, ellas formarán una base para N(T), y po- 
demos obtener cualquier v de N(T) formando todas las combinaciones lineales 

v = Í+! + ■••-(- t k v k , 

donde t x ,... ,tk son escaiares arbitrarios. Esta combinación lineal se llama solu- 
ción general del sistema homogéneo. Si b es una solución particular del sistema no 
homogéneo, entonces todas las soluciones x vienen dadas por 

x = b + t-iPi + • • • + t k v k . 

Esta combinación lineal se llama solución general del sistema no homogéneo. 
E1 teorema 2.18 puede ponerse en esta otra forma: 


teorema 2.19. Sea T:V„ -* V m la transformación lineal tal que T(x) = y, 
donde x = (x, ,..., x„), y = (y t ,..., y m ), e 


y f — 2 a tk x k P a ra i = 1, 2 ,... , m . 
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Sea k la dimensión del núcleo de T. Si v, ,..., v k son k soluciones independien- 
tes del sistema homogéneo T(x) = O, y si b es una solución particular del sistema 
no homogéneo T(x) = c, entonces la solución general del sistema no homogéneo es 

x = b + tiVí + • ■ • + t k v k , 
siendo t k ,... ,tu escalares cualesquiera. 

Este teorema no nos dice cómo encontrar una solución particular b del sis- 
tema no homogéneo, ni las soluciones v, ,... ,v k del sistema homogéneo, Nos dice 
tan sólo lo que puede obtenerse cuando el sistema no homogéneo tenga una so- 
lución. E1 siguiente ejemplo, aunque muy sencillo, ilustra el teorema. 

ejemplo. E1 sistema x + y = 2 tiene como sistema homogéneo asociado la 
ecuación x + y = 0. Por consiguiente, el núcleo consta de todos los vectores de 
V 2 de la forma (t, —t), siendo t arbitrario. Puesto que (t, —t) = /(1, — 1), éste es 
un subespacio uni dimensional de V 2 con base (1, —1). Una solución particular 
del sistema no homogéneo es (0,2). Por tanto, la solución general del sistema no 
homogéneo viene dada por 

(x,y) = (0,2) + /(1,-1) o x = t, y = 2 — t, 
siendo t arbitrario. 


2.18 Técnicas de cálculo 

Volvamos al problema del cálculo efectivo de las soluciones de un sistema 
lineal no homogéneo. Aunque se han desarrollado muchos métodos para atacar 
este problema, todos exigen cálculos considerables si el sistema es de gran tama- 
no. Por ejemplo, para resolver un sistema de diez ecuaciones con el mismo número 
de incógnitas pueden ser necesarias varias horas de cálculos, incluso con la ayuda 
de un calculador manual. 

Vamos a comentar un método muy utilizado, que se llama método de elimi- 
naciónde Gauss-Jordan,que es relativamente sencillo y puede programarse fácil- 
mente para calculadores electrónicos de alta velocidad. E1 método consiste en la 
aplicación de tres operaciones fundamentales a las ecuaciones lineales del sistema: 

1) Intercambio de dos ecuaciones. 

2) Multiplicación de todos los términos de una ecuación por un escalar no 
nulo. 

3) Suma de una ecuación a otra multiplicada por un escalar. 
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Cada vez que efectuamos una de esas operaciones en el sistema obtenemos un 
nuevo sistema con las mismas soluciones. Dos sistemas con las mismas soluciones 
se llaman equivalentes. Efectuando esas operaciones una tras otra de modo siste- 
mático llegamos por fin a un sistema equivalente que puede resolverse a simple 
vista. 

Ilustraremos el método con algunos ejemplos particulares. Se verá entonces 
cómo se aplica el método en general. 

ejemplo 1. Sistema con solución única. Consideremos el sistema 


2x - 5y + 4z = -3 
x-2y+ z = 5 
x — 4y + 6z = 10. 


Este sistema tiene solución única, x =124, y =75, z = 31, que obtendremos por el 
método de eliminación de Gauss-fordan. Para evitar trabajo no copiamos las le- 
tras x, y, z ni los signos de igualdad, sino que trabajaremos con la matriz ampliada 


(2.24) 


obtenida al adjuntar los segundos miembros del sistema a la matriz de 
los coeficientes. Las tres operaciones básicas antes mencionadas se efectúan con 
las filas de la matriz ampliada y se llaman operaciones fila. En cualquier fase del 
proceso podemos poner las letras x, y, z e intercalar los signos de igualdad en las 
verticales correspondientes obteniendo ecuaciones. Nuestro objetivo es llegar a 


(2.25) 


la matriz ampliada después de una sucesión de operaciones fila. E1 correspondiente 
sistema de ecuaciones es x = 124, y = 75, z = 31, que nos da la solución 
deseada. 
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E1 primer paso es obtener un 1 en el vértice superior izquierdo de la matriz. 
Podemos hacerlo intercambiando la primera fila de la matriz dada (2.24) con 
la segunda o con la tercera. O bien, podemos multiplicar la primera fila por V 2 , 
Intercambiando las filas primera y segunda, obtenemos 


'1 -2 1 5' 

2-54 -3 

1 -4 6 10 


E1 paso siguiente consiste en convertir todos los restantes elementos de la 
primera columna en ceros, dejando el primero intacto. Basta para ello multiplicar 
la primera fila por — 2 y sumar el resultado a la segunda fila. Luego multiplica- 
mos la primera fila por — 1 y sumamos el resultado a la tercera. Después de esas 
dos operaciones, obtenemos 


'i -2 1 

5' 

0-12 

-13 

0-2 5 

5_ 


Repetimos ahora el proceso en la matriz reducida 


que 


aparece junto a los dos ceros. Podemos obtener 1 en su vértice superior izquierdo 
multiplicando la segunda fila de| (2.26) por —1. Esto nos da la matriz 


'1 -2 

1 

5' 

0 1 

-2 

13 

0 -2 

5 

5 


Multiplicando la segunda fila por 2 y sumando el resultado a la tercera, conse- 
guimos 


1 -2 1 

5' 

0 1 -2 

13 

0 0 1 

31 . 


A1 llegar aquí, el correspondiente sistema de ecuaciones viene dado por 
x-2y+ z = 5 
y - 2z = 13 
z = 31 . 
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Estas ecuaciones pueden resolverse sucesivamente partiendo de la tercera y tra- 
bajando hacia atrás, dándonos 

z = 31, y = 13 + 2z = 13 + 62 = 75, * = 5 + 2y - z = 5 + 150 - 31 = 124. 

O bien, podemos continuar el proceso de Gauss-Jordan convirtiendo en ceros 
todos los elementos situados por encima de la diagonal de unos en la segunda 
y en la tercera columnas. Multiplicando la segunda fila de (2.27) por 2 y su- 
mando el resultado a la primera, obtenemos 


‘l 0 -3 

31" 

0 1 -2 

13 

0 0 1 

31. 


Por último, multiplicamos la tercera fila por 3 y sumamos el resultado a la primera 
fila, y luego multiplicamos la tercera fila por 2 y sumamos el resultado a la se- 
gunda con lo que llegamos a la matriz (2.25). 


efemplo 2. Sistema con más de una solución. Consideremos el siguiente 
sistema de 3 ecuaciones con 5 incógnitas: 


2x — 5y + 4z + u — v = —3 
(2.28) x-2y+ z- u + v = 5 

x-4y + 6z + 2u-v=ÌO. 

La correspondiente matriz ampliada es 


"2-5 4 1 

1 - 21-1 
1-4 6 2 


-1 

1 

-1 


Los coeficientes de x,y,z y los segundos miembros son los mismos que los del 
ejemplo 1. Si efectuamos las mismas operaciones fila que en el ejemplo 1, llega- 
mos a la matriz ampliada 
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E1 correspondiente sistema de ecuaciones puede resolverse respecto a x, y, z en 
función de u y v dándonos 

x = 124 + 16« - 19i> 
y = 75 + 9« — 11 u 
z = 31 + 3 u — 4v . 

Si hacemos u = /, y v = t 2 , siendo y t 2 números reales arbitrarios, y determi- 
minamos x, y, z mediante esas ecuaciones, el vector (x, y, z, u, v) de V r dado por 

(x,y, z, u, v) = (124 + 16/ x - 19í 2 ,75 + 9 t t — 11 / 2 , 31 + 3^ - 4r 2 , t x , r 2 ) 

es una solución. Separando los términos que contienen t x y t 2 , tendremos: 

(x, y, z, u, v) = (124, 75, 31, 0, 0) + t x ( 16, 9, 3, 1, 0) + / 2 (—19, -11, -4, 0, 1). 

Esta ecuación nos da la solución general del sistema. E1 vector (124, 75, 31, 0, 0) 
es una solución particular del sistema no homogéneo (2.28). Los dos vectores 
(16, 9, 3, 1, 0) y ( — 19, —11, —4, 0, 1) son soluciones del correspondiente sis- 
tema homogéneo. Puesto que son independientes, constituyen una base para el 
espacio de todas las soluciones del sistema homogéneo. 

eiemplo 3. Sistema sin solución. Consideremos el sistema 

2x — 5y + 4z = —3 

(2.29) x-2 y+ z= 5 

x — 4y + 5z = 10 . 

Es idéntico al del ejemplo 1 excepto que en el coeficiente de z en- la tercera ecua- 
ción ha sido cambiado el 6 por un 5. La matriz ampliada correspondiente es 

~2 -5 4 —3 

1-21 5 - 

1 -4 5 10 

Aplicando las mismas operaciones fìla usadas en el ejemplo 1 para transformar 
(2.24) en (2.27), llegamos a la matriz ampliada 

~1 -2 1 5~ 

( 2 -30) 0 1 -2 13 ■ 

_0 0 0 31 
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Cuando la última fila se expresa como ecuación, llegamos a 0 = 31. Por consi- 
guiente el sistema original no tiene solución puesto que los dos sistemas (2.29) 
y (2.30) son equivalentes. 

En cada uno de los ejemplos anteriores, el número de ecuaciones no excedía 
al de incógnitas. Si hay más ecuaciones que incógnitas, el proceso de Gauss- 
Jordan puede aún aplicarse. Por ejemplo, consideremos el sistema del ejemplo 1, 
que tiene la solución x = 124, y = 75, z = 31. Si adjuntamos una nueva ecua- 
ción a este sistema que sea satisfecha por la misma terna, por ejemplo, la ecua- 
ción 2x — 3y + z = 54, entonces el proceso de eliminación nos lleva a la matriz 
ampliada 

’l 0 0 124’ 

0 10 75 

0 0 1 31 

0 0 0 0 _ 

con una fila de ceros en la parte inferior. Pero si adjuntamos una nueva ecuación 
que no se satisfaga por la terna (124, 75, 31), por ejemplo la ecuación 
x + y + z = 1 , entonces el proceso de eliminación nos conduce a la matriz 
ampliada de la forma 

'l 0 0 124' 

0 1 0 75 

0 0 1 31 

0 0 0 a 

donde a ¥= 0. La última fila nos da una ecuación contradictoria 0 = a lo que 
prueba que el sistema no tiene solución. 


2.19 Inversas de matrices cuadradas 

Sea A = (fl„) una matriz cuadrada n X n, tal que BA = I, siendo I la ma- 
triz identidad n X n, entonces A se llama no singular y B la inversa de A por 
la izquierda. 

Elegida la base usual de los vectores coordenados unitarios de V„, sea 
T:V„ V„ la transformación lineal con matriz m(T) = A. Tenemos entonces el 
siguiente 
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teorema 2.20. La matriz A es no singular si y sólo si T es invertible. Si 
BA = I, entonces B = 

Demostración. Supongamos que A es no singular y que BA = I. Demostra- 
remos que T(x) = 0 implica x = O. Dado x tal que T(x) = O, sea X la matriz 
columna n X 1 formada a partir de los componentes de x. Puesto que T(x) = O, 
la matriz producto AX es una matriz columna n X 1 formada por ceros, así que 
B(AX) es también una matriz columna de ceros. Pero B(AX) = (BA)X = IX = X, 
por lo que todo componente de x es 0. Por consiguiente, T es invertible, y Ia 
ecuación TT~ l = I implica que m(T)m(T~ ') = I o Am(T~ l ) = I. Multiplicando 
a la izquierda por B, encontramos m(T~') = B. Recíprocamente, si T es invertible 
entonces T~ X T es la transformación idéntica así que m(T~')m(T) es la matriz 
identidad. Por consiguiente A es no singular y m(T~ l )A = I. 

Todas las propiedades de las transformaciones lineales invertibles tienen su 
contrapartida para las matrices no singulares. En particular, las inversas por la 
izquierda (si existen) son únicas, y toda inversa por la izquierda es también in- 
versa por la derecha. Dicho de otro modo, si A es no singular y BA = I, enton- 
ces AB = I. Llamamos a B la inversa de A y la designamos por A~\ La inver- 
sa A ~' también es no singular y su inversa es A. 

Seguidamente demostramos que el problema de Ia determinación efectiva de 
los elementos de la inversa de una matriz no singular es equivalente a la resolu- 
ción de n sistemas lineales no homogéneos. 

Sea A = (aa) no singular y sea A ~ 1 = (bij) su inversa. Los elementos de A 
y A~ x están ligados por las n 2 ecuaciones. 


(2.31) 2a ik b ki = Ò ti , 


siendo òi,- =1 si i = j, y (5 ; ,- = 0 si i j. Para cada valor fijo de /', podemos 
considerar (2.31) como un sistema no homogéneo.de n ecuaciones lineales con 
n incógnitas b ti ,b 2i ,..., b nj . Puesto que A es no singular, cada uno de esos 
sistemas tiene solución única, la columna / de B. Todos esos sistemas tienen la 
misnia matriz de coeficientes A y difieren tan sólo en sus segundos miembros. 
Por ejemplo, si A es una matriz 3X3, existen 9 ecuaciones en (2.31) que pueden 
representarse como 3 sistemas lineales que tienen las siguientes matrices ampliadas: 
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Si aplicamos el proceso de Gauss-Jordan, llegamos a las respectivas matrices am- 
pliadas 


‘1 0 0 

bn 


O 

o 

b 12 ~ 


'1 0 0 

éis" 

0 1 0 

b 2l 


0 10 

b 2 2 


0 1 0 

b 23 

0 0 1 

*31. 


0 0 1 

V 


0 0 1 

b 33 _ 


En la práctica aprovechamos el hecho de que los tres sistemas tienen la misma 
matriz de coeficientes y resolvemos los tres sistemas de una vez trabajando con 
la matriz ampliada 


«ii 

«12 

a lz 

i 

0 0' 

«21 

«22 

a 2 3 

0 

1 0 

.«31 

«32 

*33 

0 

0 1 


E1 proceso de eliminación nos lleva a 


o 

O 

bn b 12 b u 

0 1 0 

b 21 b 22 b 2 3 

O 

O 

b 31 b 32 * 33 _ 


La matriz de la parte derecha de la barra vertical es la inversa deseada. La de la 
izquierda es la matriz identidad 3X3. 

No es preciso conocer de antemano si A es no singular. Si A es singular, pode- 
mos aún aplicar el método de Gauss-Jordan, pero ocurre que en el proceso uno 
de los elementos de la diagonal se convierte en cero, y no será posible transformar 
A en la matriz identidad. 


LFn sistema de n ecuaciones lineales con n incógnitas, está representado por 
Ỳ a a*x* = Ci, i=l ,2 . n. 


que se puede escribir, de una manera más simple, como una ecuación matricial 


AX = 


C, 


donde /t = (a lV ) es la matriz de los coeficientes, y X y C matrices columna, 
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Si A es no singular, la única solución del sistema está dada por X=A -I C. 


2.20 Ejercicios 

Aplicando el proceso de Gauss-Jordan a cada uno de los sistemas siguientes, determinar 
la solución general, si existe. 


1. x +y + 3z = 5 
2x -y + 4z = 11 

-y + z = 3. 

2. 3x + 2y + z = 1 
Sx +3y + 3z =2 

x + y — z = 1. 

3. 3x +2y + z = 1 
5x +3y +3z =2 
1 x + 4y + 5z = 3. 

4. 3x + 2y + z = 1 
5x + 3y +3z =2 
Ix + 4y + 5z = 3 

x + y - z =0. 


5. 3x - 2y + 5z + u = 1 
■x + y -3z +2u =2 
6x + y — 4z + 3« = 7. 

6. x + y — 3z + u = 5 
2x - y + z -lu= 2 
Ix + y - Iz + 3u = 3. 

7. x + y + 2z + 3 u + 4v = 0 

2x + 2y + Iz + Uu + 14v = 0 

3x + 3y + 6z + 10« + 15v = 0. 

8. x - 2y + z +2u = -2 

2x +3y — z — 5u = 9 

4 x-y+z-u= 5 

5x -3y +2z + u = 3. 


9. Demostrar que el sistema x + y + 2z = 2, 2x — y + 3z = 2, 5x — y + az = 6, tiene so- 
lución única si a ^ 8. Hallar todas las soluciones cuando a = 8. 

10. a) Determinar todas las soluciones del sistema 

5x +2y — 6z + 2 u = —1 
x - y + z - u = - 2. 
b) Determinar todas las soluciones del sistema 

5x + 2y — 6z + 2u = —1 
* - y + z - u= -2 
x + y + z = 6. 

11. Este ejercicio nos indica cómo se determinan todas las matrices no singulares 2x2. 
Demostrar que 
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o singular si y sólo si ad — bc ^ 0, en cuyo c 


ad-bcl- c a \' 

Determinar !a inversa de cada una de !as matrices de !os ejercicios del 12 al 16. 


12 . 


13. 


14. 


' 2 3 4' 

2 11 . 

_-l 1 2_ 

'1 2 2' 

2-1 1 . 

_1 3 2_ 

' 1-2 1 ' 
-2 5 -4 . 

1 -4 6_ 


'1 2 3 4' 

0 12 3 
0 0 12 ' 

.0 0 0 1 . 

“0 1 0 0 0 O^ 

2 0 2 0 0 0 

0 3 0 1 0 0 

0 0 1 0 2 0 

0 0 0 3 0 1 

0 0 0 0 2 0 _ 


2.21 Ejercicios varios sobre matrices 

1. Si una matriz cuadrada tiene una columna de ceros o una fila de ceros, demostrar que 
es singular. 
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2. Para cada una de las proposiciones siguientes relativas a matrices n X n, dar una de- 
mostración o un contraejemplo. 

a) Si AB + BA = O, entonces A 2 B 3 = B 3 A 2 . 

b) Si A y B son no singulares, entonces A + B es no singular. 

c) Si A y B son no singulares, entonces AB es no singular. 

d) Si A, B, y A + B son no singulares, entonces A — B es no singular. 

e) Si A 3 = O, entonces A — I es no singular. 

f) Si el producto de k matrices A } ... A k es no singular, cada una de las matrices A, es 
no singular. 

3. Si A = j^ J , hallar una matriz no singular P tal que P 'AP = 

4. La matriz A = J , donde i 2 = —1, a = J(1 + \/5), y b = \ 

propiedad de que A 2 = A. Describir en forma completa todas las matrices A, 2x2, 
con elementos complejos tales que A 2 = A. 

5. Si A 2 = A, demostrar que (A + /)* = / + ( 2 h — 1 )A. 

6. La teoría de la relatividad utiliza un conjunto de ecuaciones de la forma x' = a(x — vt), 
y' = y, z' = z, t' = a(t — vx/c 2 ). Aquí v representa la velocidad de un objeto que se 
mueve, c la velocidad de la luz, y a = c/Vc 2 — v 2 , donde H < c. La transformación 
que aplica el vector bi dimensional (x, t) en (x', t’) se llama transformación de Lorentz. 
Su matriz relativa a las bases usuales se designa con L(v) y viene dada por 

£w -“[-,U 7]- 


; d - Vs), tiene la 


Obsérvese que L(v) es no singular y que 1(0) = 1. Demostrar que L(v)L(u) = L(w), 
siendo w = (u + v)c 2 /(uv + c 2 ). Es decir, el producto de dos transformaciones de 
Lorentz es otra transformación de Lorentz. 

, Si cambiamos las filas por las columnas en una matriz rectangular A, la nueva matriz 
así obtenida se llama la transpuesta de A y sedesignapor A*. Por ejemplo, si tenemos 

41 


■ P 2 3 1 

L4 5 ój’ 


entonces A l 


2 5 


Demostrar que las transpuestas tienen las propiedades siguientes: 


a) (A*)‘ = A. 
d) (AB)t = B*A‘. 

8. Una matriz cuadrada A si 


b) (A + BY = A‘ + B l . 
e) (AT 1 = (A^Y si 
llama matriz ortogonal si AA l 


c) (cAy = cAK 
es no singular. 

: I. Comprobar que la maftriz 


r* -“i 

Lsen 6 cos ej 


es ortogonal para cada número real 0. Si A es cualquier 
fìlas, consideradas como vectores de V„, for 


cos 6 

matriz ortogonal n X n, demostrar que 
man un conjunto ortogonal. 

9. Para cada una de las proposiciones siguientes acerca de las matrices n 
demostración o en su lugar un contraejemplo. 
a) Si A y B son ortogonales, A + B es ortogonal. 
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b) Si A y B son ortogonales, AB es ortogonal. 

c) Si A y AB son ortogonales, B es ortogonal. 

10. Matrices de Hadamard, llamadas así por Jacques Hadamard (1865-1963), son aquellas 
matrices n x n con las propiedades siguientes: 

1. Cada elemento es 1 ó — 1. 

II. Cada fila, considerada como un vector de V», tiene longitud igual a \/ n. 

III. E1 producto escalar de dos filas distintas cualesquiera es 0. 

Las matrices de Hadamard se presentan en ciertos problemas de geometría y en la 
teoría de números, y han sido aplicadas recientemente en la codificación óptima para la 
comunicación espacial. A pesar de su aparente simplicidâd, presentan muchos problemas 
sin resolver. E1 principal problema no resuelto en este momento es el de determinar todos 
los valores de n para los que existe una matriz de Hadamard n X n. Este ejercicio da 
idea de una solución parcial. 

a) Determinar todas las matrices de Hadamard 2x2 (hay exactamente 8). 

b) Esta parte del ejercicio esboza una demostración sencilla del siguiente teorema: 
Si A es una matriz de Hadamard n X n, siendo n > 2, entonces n es un múltiplo de 4. 
La demostración se basa en dos lemas muy sencillos relativos a los vectores en el espa- 
cio de dimensión n. Demostrar cada uno de esos lemas y aplicarlos a las filas de la 
matriz de Hadamard para demostrar el teorema. 


lema 1. Si X, Y, Z son vectores ortogonáles de V n , se tiene 
(X+ Y)(X+Z)= ||Xf. 

lema 2. Póngase X — (x, ,, x„), Y = (y t .y„), Z = (z^,..., z„). 

Si cada componente x„ y„ z f es 1 o — 1, el producto (x t + y i)(xt + z.) es 0 ó 4. 
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DETERMINANTES 


3.1 Introducción 


En numerosas aplicaciones del Álgebra lineal a la Geometría y al Análisis 
el concepto de determinante desempena un papel importante. Este capítulo estudia 
las propiedades fundamentales de los determinantes y algunas de sus aplicaciones. 

En el Volumen I se introdujeron los determinantes de segundo y tercer orden 
como una notación útil para expresar ciertas fórmulas en forma compacta. Re- 
cordemos que el determinante de segundo orden se defìnió mediante la fórmula 


ûll «12 

(3.1) I = a n a 2ì - a 12 a 21 . 

| «21 a Z2 | . 

«11 «12 

A pesar del parecido de las notaciones, el determinante (escrito con 

| «21 «22 I 

r«n «12] 

dos barras verticales) es conceptualmente distinto de la matriz (con 

L « 2i « 22J 


dos corchetes). E1 determinante es un número asignado a la matriz y que se 
calcula con la fórmula (3.1). Para acentuar esta conexión también escribimos 


«11 

«12 


« 12 ‘ 



= det 

«21 

«22 

L«21 

« 22 . 


Los determinantes de tercer orden se defìnieron en el Volumen I en función 
de determinantes de segundo orden mediante la fórmula 


«11 

«12 

« 13 ' 

^ I «22 «23 

«21 «23 

«21 «22 

«21 

&22 

«23 


-«12 

+ «13 




1 «32 «33 | 

| «31 «33 | 

1 «31 «32 | 

«31 

«32 

« 33 . 
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Este capítulo considera el caso más general, el determinante de una matriz cua- 
drada de orden n para cualquier entero n ^ 1. Nuestro punto de vista consiste en 
tratar el determinante como una función que asigna a cada matriz cuadrada A 
un número llamado determinante de A y que se indica por det A. Se puede definir 
esa función por medio de una fórmula que generaliza (3.1) y (3.2). Tal fórmula 
es una suma que contiene n\ productos de elementos de A. Para valores grandes 
de n esa fórmula es de difícil manejo y se usa poco en la práctica. Es preferible 
estudiar los determinantes desde otro punto de vista que ponga de manifiesto con 
mayor claridad sus propiedades esenciales. Tales propiedades, importantes en 
las aplicaciones, se tomarán como axiomas para definir una función determinante. 
En principio, nuestro plan constará de tres partes: 1) JustificarTa elección de los 
axiomas. 2) Deducir otras propiedades de los determinantes a partir de los axio- 
mas. 3) Demostrar que existe una función y sólo una que satisfaga a tales 
axiomas. 

3.2 Justificación de la elección de los axiomas para una función determinante 

En el Volumen I se demostró que el producto mixto de tres vectores 
A t , A 2 , A s en E s puede expresarse como el determinante de una matriz cuyas 
filas son los vectores dados. Así tenemos 


A^xAz-A 3 


a 11 °12 °13 

a 21 a 22 °23 

.°31 °32 °33j 


donde A s = (o u , a 12 , a 13 ) ,A 2 = (a 21 , a 22 , a^), y A 3 = ( a 31 , a 32 , a 33 ). 

Si las filas son linealmente independientes el producto mixto no es nulo; 
el valor absoluto del producto es igual al volumen del paralelepípedo determinado 
por los tres vectores A 3 , A 2 , A 3 . Si las filas son linealmente dependientes el pro- 
ducto mixto es nulo. En tal caso A 3 , A 2 , A 3 son coplanarios y el paralelepípedo 
degenera en una figura plana de volumen nulo. 

Algunas de las propiedades del producto mixto justifican la elección de los 
axiomas para una función determinante en el caso n-dimensional. Para establecer 
esas propiedades en forma apta para la generalización, consideramos el producto 
mixto como una función de los tres vectores fila A x , A 2 , A s . Designamos esta 
función por d; así pues. 


d(A 3 , A 2 , A 3 ) = A x x A 2 -A 3 . 
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Centremos nuestra atención en las propiedades siguientes: 

a) Homogeneidad en cada fila. Por ejemplo, la homogeneidad en la primera 
fila establece que 

d(tA x , A 2 , A 3 ) = t d(A !, A 2 , A 3 ) para todo escalar t. 

b) Aditividad en cada fila. Por ejemplo, la aditividad en la segunda fila 
Significa que 


d(A lt A 2 + C, A 3 ) = d(A x , A 2 , A 3 ) + d(A x , C, A a ) 


para todo vector C. 

c) El producto mixto es nulo si dos de las filas son iguales. 

d) Normalización: 

d(i,j, k) = 1, donde i = (1, 0 ,0 ), j = (0,1,0), k = (0, 0 , 1) 

Cada una de esas propiedades puede comprobarse fácilmente a partir de las 
propiedades de los productos escalar y vectorial. Algunas son sugeridas por la 
relación geométrica entre el producto mixto y el volumen del paralelepípedo de- 
terminado por los vectores geométricos A x , A 2 , A 3 . E1 significado geométrico 
de la propiedad aditiva b) en un caso particular es de especial interés. Si toma- 
mos C = A x en b) el segundo término del segundo miembro es cero en virtud 
de c), y la relación b) se transforma en 

(3-3) d(A x ,A 2 + A x , A 3 ) = d(A x , A 2 , A s ). 


Volumen = d(A ,. A ,, A :l ) Volumen = d(A ,, A , + A ,, A :i ) 



Figura 3.1 

Interpretación geométrica de la propiedad d(A, Ai, AJ = d(A,,A , + _A 2 , A,). Los dos 
paraíelepípedos tienen volúmenes iguales. 
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Esta propiedad se pone de manifiesto en la fìgura 3.1 que representa un paralele- 
pípedo determinado por A x , A 2 , A 3 , y otro determinado por Ai ,A X + A 2 ,A 3 . 
La igualdad (3.3) establece que esos dos paralelepípedos tienen volúmenes iguales. 
Geométricamente ello es evidente ya que los paralelepípedos tienen alturas iguales 
y bases de igual área. 

3.3 Conjunto de axiomas que definen una función determinante 

Las propiedades del producto mixto mencionadas en la sección anterior 
pueden generalizarse con facilidad y utilizarse como axiomas para determinantes 
de orden n. Si A = (a„) es una matriz n X n con elementos reales o complejos, 
designemos sus filas por A x ,...,An. Así, la fila i-ésima de A es un vector en E„ 
dado por 


Ai = (Oa, da, ■ ■ ., a in ). 

Consideremos el determinante como una función de las n filas Ai,... ,A n y de- 
signemos su valor por d(A x ,..., A„) o por det A. 

DEFINICIÓN AXIOMÁTICA DE UNA FUNCIÓN DETERMINANTE. Una funCÌÓn COU 
valores reales o complejos d, definida para cada n componentes ordenadas de 
los vectores A\,..., A„ en E„, se denomina función determinante de orden n 
si satisface los siguientes axiomas cualesquiera que sean los vectores A \,..., A„ 
y C en E„: 

axioma 1. homogeneidad en cada fila. Si se multiplica la k-ésima fila 
A k por un escalar t, el determinante queda también multiplicado por t: 

d(...,tA k ,...) = td(...,A k ,...). 

axioma 2. aditividad en cada fila. Para cada valor de k tenemos 
d(A 1} ...,A k + C,...,A n ) = d(A 1 ,...,A k ,...,A n ) + d(A 1 ,...,C,...,A„) 

AXIOMA 3. EL DETERMINANTE SE ANULA SI DOS FILAS CUALESQUIERA SON 
IGUALES: 

d(A x ,..., A„) = 0 si Ai = Ai (para ciertos i y j tales que i + j.) 

AXIOMA 4. EL DETERMINANTE DE LA MATRIZ IDENTIDAD ES IGUAL A 1: 

d(I x ,...,/„)= 1, siendo h el k-ésimo vector coordenado unidad. 
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Los dos primeros axiomas establecen que el determinante de una matriz es 
una función lineal de cada una de sus fìlas. Con frecuencia esto se expresa di- 
ciendo que el determinante es una función multilineal de sus filas. Aplicando 
reiteradamente la linealidad a la primera fila podemos escribir 

à ( í t k C k ,A 2 ,...,A n ^j t k d(C k , A 2 . A „), 

siendo ti,... ,t p escalares y C, ,... ,C P vectores cualesquiera de E„. 

A veces se utiliza una versión particular del axioma 3: 

AXIOMA 3'. EL DETERMINANTE SE ANULA SI DOS FILAS CONSECUTIVAS SON 
IGUALES: 

d(Ai,. .. , A n ) = 0 si A k = para un cierto k = 1, 2,.. . , n — 1. 

Se demuestra más adelante que para un n dado existe una y sólo una función 
d que satisface los axiomas 1, 2, 3' y 4. E1 teorema que sigue da únicamente las 
propiedades de los determinantes deducidas a partir de los axiomas 1, 2 , y 3'. 
Una de esas propiedades es el axioma 3. Se observará que el axioma 4 no se 
utiliza en la demostración de este teorema. Tal observación será de utilidad más 
adelante cuando demostremos la unicidad de la función determinante. 

teorema 3.1. Una función determinante que satisfaga los axiomas 1, 2, y 
3' tiene además las siguientes propiedades: 

a) El determinante se anula si alguna fila es O: 


d(A x . A n ) — 0 si A k = O para algún k. 

b) El determinante cambia de signo si se intercambian dos filas consecutivas: 

d(..., A k , A k+l , ...) = -d(..., A k+1 ,A k , ...). 

c) El determinante cambia de signo si dos filas cualesquiera A , y A; con 
i j se intercambian. 

d) El determinante se anula si son iguales dos filas cualesquiera: 
d(A x ,..., A n ) = 0 si Ai = Aj para un par i, j, con i¥= j . 

e) El determinante se anula si sus filas son linealmente dependientes. 
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Demostración. Para demostrar a) tomemos simplemente t = 0 en el axio- 
ma 1. Para demostrar b), sea B una matriz que tenga las mismas filas que A 
excepto las filas k y k + 1. Sean las filas fl* y 8*+i iguales a A* + A/t +1 . Enton- 
ces según el axioma V der R = 0 . Así podemos escribir 

4-.^ + 4i.A + 4 1 --) = o. 

Aplicando la propiedad aditiva a las filas A: y k + í podemos escribir esa igualdad 
en la forma: 

d{.. .,A k ,A k , ...) + d{.. .,A k ,A^, ...) + d{.. .,A^,A k ,...) 

+ d(...,A k+1 ,A k+1 ,...) = 0. 

Los términos primero y cuarto son nulos en virtud del axioma 3'. Luego el segun 
do y tercer términos son opuestos, lo que demuestra b). 

Para demostrar c) podemos suponer que i < j. Se pueden intercambiar las 
filas Ai y Aj efectuando un número impar de transposiciones de filas consecutivas. 
Primero transponemos la fila A,- sucesivamente con las filas A,-, , Aj - 2 ,..., A,. 
Esto exige j — i transposiciones. Luego la fila A, la transponemos sucesivamente 
con las filas Ai +1 , Ai +t ,..., Aj-i. Esto supone j — i — 1 transposiciones. Cada 
transposición o intercambio de filas consecutivas invierte el signo del determi- 
nante. E1 número total de cambios de signo es pues (/—/)+(/—i— 1)=2(/—*) — 1 
que es un número impar, lo que demuestra c). 

Para demostrar d), sea B la matriz obtenida invirtiendo en A las filas A, 
y Aj. Puesto que A,- = A/, se tiene B = A y por tanto det B = det A. Pero, 
según c) det B = — det A . Por consiguiente det A = 0. 

Para demostrar e) supongamos que existen los escalares Ci,..., c„ , no todos 
nulos, tales que ^ k=1 c k A k = O. Entonces toda fila Ak con Ck ¥= 0 puede expre- 
sarse como combinación lineal de otras fìlas. Para mayor sencillez, supongamos 
que Ai es combinación lineal de las otras, por ejemplo A x = 2" =2 En virtud 
de la linealidad de la primera fila tenemos 

à(A k , A z . A„) = à{j,t k A k , A, .A„j =ft k d(A k ,A 2 ,...,A n ). 

Pero cada término d(Ak , A 2 ,..., A„) de la última suma es cero ya que A* es 

igual por lo menos a una de las filas A 2 . A„ . Luego toda la suma es cero. 

Si la fila A, es una combinación lineal de las otras filas, razonamos en forma 
análoga, utilizando la linealidad en la fila i. Esto demuestra e). 
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3.4 Cálculo de determinantes 

A1 llegar aquí puede ser instructivo calcular algunos determinantes, utilizan- 
do tan sólo los axiomas y las propiedades del teorema 3.1, suponiendo siempre 
que las funciones determinantes existen. En cada uno de los ejemplos que siguen 
no aplicamos el axioma 4 hasta ei final del cálculo. 

ejemplo 1. Determinante de una matriz 2x2. Queremos demostrar que 

, r a « 

(3.4) det = a u a 2a - a 12 a 21 . 

L«ai Û22 J 

Escribamos los vectores fila como combinaciones lineales de los vectores coorde- 
nados unitarios i = (1,0) y / = (0,1): 

A i = (ûu > « 12 ) = «ii» + « 12 /, A 2 = (a 21 , a 22 ) = a 21 i + a 22 j. 

Utilizando la linealidad en la primera fila tenemos 

d{A x , A 2 ) = d(a n i + a 12 j, A 2 ) = a n d(i, A 2 ) + a 12 d(j, A 2 ). 

Utilizándola nuevamente en la segunda fila se obtiene 

d(i, A 2 ) = d(i, a 21 i + a 22 j) = a 21 d(i, i) + a 22 d(i,j) = a 22 d(i,j), 

puesto que d (i, i) =0. Del mismo modo encontramos 


d(j, A 2 ) = d(j, a 2l i + a 22 j) = a 21 d(j, i) = — a 21 d(i,j). 
Por tanto obtenemos 


d(Ai, A 2 ) — (a n a 22 — a 12 a 21 ) d(i,j). 

Pero d(i,j) = 1 según el axioma 4, con lo que d(A x , A 2 ) = a n a 22 — a 12 a 21 como 
se afìrmó. 

Este razonamiento demuestra que si una función determinante existe para 
las matrices 2X2, debe tener necesariamente la forma (3.4). Recíprocamente, 
es fácil comprobar que esa fórmula define, efecdvamente, una función determi- 
nante de orden 2. Por consiguiente hemos demostrado que existe una y sólo una 
función determinante dè orden 2. 
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ejemplo 2. Determinante de una matriz diagonal. Una matriz cuadrada 
de la forma 

~a n 0 
0 a 22 

A = 

_0 0 ••• fl BB J 



se denomina matriz diagonal. Cada elemento ûì; no perteneciente a la diagonal 
principal, (i ¥= /') es cero. Vamos a demostrar que la determinante de A es igual 
al producto de los elementos pertenecientes a la diagonal 

(3.5) det A = fliiû 21î • ■ • a BB . 

La fila k de A es el producto de un escalar por el &-ésimo vector coordenado 
unidad, A k = a kk h . 

Aplicando repetidamente la propiedad de homogeneidad llegamos a 

det^4 =d(A x ,..., A n ) = d(a n I ly ... ,.fl BB / B ) = a n • • • a bb d(f x ,..., I n ). 

Esta fórmula puede escribirse en la forma 


det A = a n • • • a bb det /, 


en donde / es la matriz identidad. E1 axioma 4 nos dice que det / = 1, con lo que 
obtenemos (3.5). 

ejemplo 3. Determinante de una matriz triangular superior. Una matriz 
cuadrada de la forma 

_ «ii u 12 ••• u ln ~ 

0 «22 • • • «2„ 

U = . . . 

_0 0 •••«„„_ 


se llama matriz triangular superior. Todos los elementos situados por debajo de 
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la diagonal principal son nulos. Vamos a demostrar que el determinante de una 
tal matriz es igual al producto de los elementos de la diagonal principal, 


det U = u u « 22 • 


Demostramos primero que det U = 0 si algún elemento Uu de la diagonal 
principal es u u = 0. Si el último elemento de esa diagonal es cero, la última 
íìla es O y det U = 0 en virtud del teorema 3.1 a). Supongamos, ahora, que sea 
nulo algún elemento uu (no precisamente el Un„). Sea por ejemplo u 22 = 0. Enton- 
ces cada uno de los n — 1 vectores fila í/ 2 ,..., U„ tienen sus dos primeros com- 
ponentes nulos. Por tanto esos vectores generan un subespacio cuya dimensión 
es por lo menos n—2. De ahí que esas n—1 filas (y por tanto todas las filas) sean 
linealmente dependientes. Según el teorema 3.1 e), det £7 = 0. Del mismo modo 
se demuestra que det £7 = 0, si es cero cualquier elemento de la diagonal prin- 
cipal. 

Vamos a demostrar ahora el caso general. Escribamos la primera fila U t como 
una suma de dos vectores-fila. 


E/ x 


Vi + Ví, 


siendo V, = [«u , 0 ,..., 0] y V t = [0, «i 2 ,..., u ln ]. En virtud de la linea- 
lidad en la primera fila tenemos 

det U = det (, U .£/„) + det , U a .£/„). 

Pero det(V[, U 2 ,...,£/„) = 0 ya que éste es el determinante de una matriz 
triangular superior con un elemento nulo en la diagonal principal. Luego tenemos 

(3.6) det U = det (K x , U z .£/„). 

Tratemos ahora el vector-fila U 2 en forma análoga, expresándolo como una suma, 


U t 


V 2 +VÍ, 


siendo 


V, - [0, « 22 , 0,.... 0] y Ví = [0, 0, w 2S .«,„]. 

Hagamos esto en el segundo miembro de (3.6) y apliquemos la linealidad en la 
segunda fila con lo que obtenemos 


(3.7) 


det U = det (F x , V 2 , U 3 ,... . £/„), 
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ya que det( V, ,V' 2 ,U 3 , U„) = 0. Repitiendo el razonamiento para cada una 
de las filas que siguen en el segundo miembro de (3.7) obtenemos fmalmente 

det U = det (V lt V 2 ,... , V n ) , 

donde (V, ,V 2 ,, V„) es una matriz diagonal con los mismos elementos que U 
en la diagonal principal. Por consiguiente, según el ejemplo 2, tenemos 

det U = u xl u 22 

como deseábamos demostrar. 

ejemplo 4. Gálculo por el método de Gauss-jordan. E1 método de elimi- 
nación de Gauss-Jordan para resolver sistemas de ecuaciones lineales es también 
uno de los mejores métodos para el cálculo de determinantes. Recordemos que 
el método consiste en la aplicación de tres tipos de operaciones a las filas de la 
matriz: 

1) Transposición de dos jilas. 

2) Multiplicación de todos los elementos de una fila por un escalar no nulo. 

3) Adición a una fila del producto de otra por un escalar. 

Efectuando una y otra vez esas operaciones de manera sistemática podemos trans- 
formar cualquier matriz cuadrada A en una matriz triangular superior U cuyo 
determinante sabemos ya calcular. Es fácil determinar la relación entre det A 
y det U. Cada vez que se realiza la operación 1) el determinante cambia de signo. 
Cada vez que se efectúa 2) con un escalar c ¥= 0, el determinante se multiplica 
por c. Si se efectúa 3) el determinante no varía. Por consiguiente, si la operación 1) 
se efectúa p veces y si c, ,... ,c q son los factores escalares que se utilizan en 
la operación 2), se tiene 

(3.8) det A = (—l) î> (c 1 c 2 • • • cj -1 det U. 

Observemos nuevamente que esta fórjnula es consecuencia tan sólo de los tres 
primeros axiomas. Su demostración no depende del axioma 4. 

3.5 E1 teorema de unicidad 

En el ejemplo 3 de la sección anterior se demostró que los axiomas 1, 2, y 3 
implican la fórmula det U = «uìí» ... u™ det /. Combinando ésta con (3.8) vemos 
que para toda matriz A,nXn, existe un escalar c (que depende de A) tal que 


(3.9) 


d(A 1 ,...,A„) = cd(I 1 ,...,J n ). 
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Además, esta fórmula es consecuencia únicamente de los axiomas 1, 2 y 3. A partir 
de este resultado fácilmente podemos demostrar que no puede existir más de 
una función determinante. 

TEOREMA 3.2. TEOREMA DE UNICIDAD PARA LOS DETERMINANTES. Sea d 
una función que satisfaga los cuatro axiomas que caracterizan una función deter- 
minante de orden n, y sea f otra función que satisfaga los axiomas 1, 2 y 3. En- 
tonces, elegido un sistema cualquiera de vectores Ai, . . ■, A„ del espacio n-di- 
mensional tenemos 

(3.10) A„) = d(A lt . .., A n )f( A, ...,/„). 

En particular, si f satisface también el axioma 4 tenemos f(A x ,..., A„) = 
= d(AiA„). 

Demostración. Sea g(Ai,..., Af)=f(A lt ...,A„)— d(A x . A„)f(U . I„) . 

Demostraremos que g(Ai,..., A„)=0 cualesquiera que sean A u ..., A„. Puesto que 
d y / satisfacen ambas los axiomas 1, 2 y 3 lo mismo le ocurre a g. Luego g tam- 
bién satisface la ecuación (3.9) ya que ésa se dedujo a partir de los tres primeros 
axiomas exclusivamente. Podemos escribir por tanto 

(3.11) g(A 1 ,...,A n ) = cg(l l ,...,I n ), 

en donde c es un escalar que depende de A. Tomando A = / en la definición 
de g y teniendo en cuenta que d satisface el axioma 4 encontramos 

g(h, ...,I n ) =f(h,. ..,/„) -f(h, ...,/») = 0. 

Por consiguiente, la ecuación (3.11) se convierte en g(Ai. A„) = 0. Esto 

completa la demostración. 


3.6 Ejercicios 

En este conjunto de ejercicios debe suponerse la existencia de una función determinante. 
Los determinantes de orden 3 pucden calcularsc con la fórmula (3.2). 

1. Calcular cada uno de los determinantes siguientes. 


2 1 1 


3 0 8 


a 1 0 

1 4 -4 

1 0 2 

b) 

5 0 7 

-14 2 

, c) 

2 a 2 

0 1 a 
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5. Una matriz triangular inferior A = (a íf ) es una matriz cuadrada que tiene nulos todos 
los elementos situados por encima de la diagonal principal; esto es, a if = 0 siempre que 
i < j. Demostrar que el determinante de una tal matriz es igual al producto de los 
elementos de la diagonal principal: det A = a n an ... a„„. 
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6. Sean cuatro funciones derivables en un intervalo (a, b). Se defîne 

|/iO) /,(*) I 

F(.x) = 

.S'zMl 

para cada jc de (a, b). Demostrar que 

|/ÍW /ïc*)| |/i(*) /,W| 

(jc) = + , , 

\gi(x) gz( x n \gi(*) gi(x)\ 


7. Establecer y demostrar una generalización del ejercicio 6 para el determinante 


F(x) 


fi(x) h(x) f 3 (x) 

gl(x) g 2 (x) gt(x) 

hi(x) h 2 (x) h 3 (x) 


\fi(x) f 2 (x) I \h(x) /,(*) 

8. a) Si F(x) = , demostrar que F (x) = \ 

\K(x) fí(x) | |A (*) /,'(*) 

b) Establecer y demostrar un resultado análogo para determinantes 3x3, suponiendo 
la validez de la ecuación (3.2). 

9. Sean U y V dos matrices triangulares superiores »X«. 

a) Demostrar que U + V y UV son matrices triangulares superiores. 

b) Demostrar que det (UV) = (det U)(det V). 

c) Si det (/#0 demostrar que existe una matriz triangular superior U~' tal que UU~'=I, 
y deducir que det (U ') = 1/det U. 

10. Calcular det A, det (y4 -1 ), y A~' para la siguiente matriz triangular superior: 

■2 3 4 !i 
0 2 3 4 

A = 

0 0 2 3 
0 0 0 2 . 


3.7 Producto de determinantes 

En esta sección utilizamos el teorema de unicidad para demostrar que el 
determinante del producto de dos matrices cuadradas es igual al producto de 
sus determinantes. 


det (AB) = (det ^)(det B), 
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Recordemos que el producto AB de dos matrices A = (a,,) y B = (b,-,-) es la 
matriz C = (c,,) cuyo elemento ij viene dado por la fórmula 


(3.12) c u =Ìa ik b M . 

E1 producto está defìnido únicamente si el número de columnas del factor de la 
izquierda A es igual al número de fìlas del factor de la derecha B. Esto ocurre 
si A y B son matrices cuadradas del mismo orden. 

En la demostración de la fórmula para el producto se hace uso de una 
sencilla relación que existe entre las filas de AB y las de A. La establecemos como 
un lema. Como de costumbre, designamos con Ai la fila i de la matriz A. 

lema 3.3. Si A es una matriz mXn y B una matriz nXp, se tiene 

(AB)i = AiB. 

Esto es, la fila i del producto AB es igual al producto de la fila Ai por B. 

Demostración. Designemos con B 1 la columna j de B y sea C = AB. En- 
tonces la suma (3.12) puede considerarse como el producto escalar de la fila i 
de A por la columna / de B, 


c ìì = A { ' B*. 

Por tanto la fila i, C„ es la matriz fila 

Q = (A { -B 1 ,Aì-B\...,Aì-B*}. 

Pero ésta es también el resultado de la multiplicación de la matriz fila Ai por B, 
ya que 


A t B = f c (í ,... , a in \ 


= [A { ■ B 1 . A t -B>]. 


Por consiguiente C, = A { B, lo que demuestra el lema 
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TEOREMA 3.4. FÓRMULA PARA MULTIPLICAR DETERMINANTES. Para dos ma- 
trices nXn cualesquiera A y B tenemos 

det (AB) = (det A)(det B). 

Demostración. Puesto que ( AB)i = AJÌ, tenemos que demostrar que 

d{AjB,A n B ) = d(A lt ..., A n )d(B x , ...,B„). 

Volviendo a utilizar el lema también tenemos B, = (IB)i = hB, donde / es la 
matriz identidad nXn. Por consiguiente d(Bi,... ,B n ) = d(hB ,..., I n B), y te- 
nemos que demostrar que 

d(AjB,..., A n B) = d(A lt ...,A n ) d(hB, ...,I„B). 

Mantengamos B fija e introauzcamos una función / definida por la fórmula 

f(A lt ...,A„) = d(AjB,..., A„B). 

La igualdad que deseamos demostrar establece que 

(3.13) f(Aj, ...,A„) = d(A lt .... A„)f(h, ...,I„). 

Es ahora asunto fácil comprobar que / satisface los axiomas 1, 2 y 3 relativos a 
una función determinante, con lo que, en virtud del teorema de unicidad, la 
igualdad (3.13) es válida para cualquier matriz A. Esto completa la demostración. 

En las dos seccciones que siguen se exponen aplicaciones de la fórmula del 
producto. 

3.8 Determinante de la matriz inversa de una matriz no singular 

Recordemos que una matriz cuadrada A se llama no singular si tiene una 
inversa B por la izquierda tal que BA = I. Si existe una inversa por la izquierda 
es única y es también inversa por la derecha, AB = /. Designemos la inversa por 
A~\ La relación entre det A y det A _1 es la que podía esperarse. 

teorema 3.5. Si una matriz A es no singular, entonces det A¥= 0 y tenemos 
det A 


(3.14) 


detA 1 
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Demostración. Según la fórmula del producto tenemos 
(det /4)(det A 1 ) = det (AA~ X ) = det / = 1. 

Luego det A ¥= 0 y (3.14) es cierta. 

E1 teorema 3.5 demuestra que la no anulación de det A es una condición ne- 
cesaria para que A sea no singular. Más adelante demostraremos que esa con- 
dición es también suficiente. Esto es, si det A¥= 0 existe A —1 . 

3.9 Determinantes e independencia de vectores 

Del teorema 3.5 puede deducirse un sencillo criterio para averiguar la inde- 
pendencia de vectores. 

teorema 3.6. Un conjunto de n vectores A x ,..., A„ de un espacio n-di- 
mensional es linealmente independiente si y sólo si d(Ai,..., A„) ¥= 0. 

Demostración. Ya demostramos en el teorema 3.2 e) que la dependencia 
lineal implica d(Ai,..., A„) — 0. Para demostrar el recíproco, se supone que 
A x ,..., A„ son linealmente independientes y se prueba que d(A^,..., A„) ¥= 0. 

Designemos con V„ el espacio lineal de las n-plas de escalares. Puesto que 
A t ,... ,A„ son n elementos independientes en un espacio n-dimensional, forma- 
rán una base para V„. Según el teorema 2.12 existe una transformación lineal 
T:V„~* V„ que aplica esos n vectores en los vectores coordenadas unidad, 

T(A k ) = I k para k = 1,2,...,«. 

Existe pues una matriz B, nXn, tal que 


A^B = I k para k = 1,2. n. 

Pero según el lema 3.3 tenemos A k B = (AB) k , siendo A la matriz con las filas 
A x ,..., A„. Luego AB — I, así que A es no singular y det A ¥=■ 0. 

3.10 Deteiminante de una matriz diagonal en bloques 

Una matriz cuadrada C de la forma 
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en la que A y B son matrices cuadradas y cada O representa una matriz de ceros, 
se denomina matriz diagonal en bloques con dos bloques A y B. Como ejemplo 
sea la matriz 5X5. 


'1 0 0 0 0 ' 
0 10 0 0 
0 0 12 3 


0 0 4 


0 0 7 8 9 


Los bloques diagonales son en este caso 


■[::] 


2 3' 
5 6 
8 9 


E1 teorema que sigue demuestra que el determinante de una matriz diagonal 
en bloques es igual al producto de los determinantes de sus bloques diagonales. 


teorema 3.7. Para dos matrices cuadradas cualesquiera A y B se tiene 


(3.15) 



= (det /<)(det B). 


Demostración. -Supongamos que A es «Xn y B es mXm. Observemos que 
la matriz diagonal en bloques dada, puede expresarse como un producto de la 
forma 


n-cxa 

donde 1„ e I m son matrices identidad de órdenes n y m respectivamente. Por con- 
siguiente, según la fórmula del producto para determinantes tenemos 


(3.16) 


'A 01 f A 01 f/„ 01 

t = det det 

L 0 B\ L O /J L O B_ 



104 


Determinantes 


\A Ol 

Consideremos ahora el determinante det como una función de n filas 

L o /J 

de A. Esto es posible debido al bloque de ceros del ángulo superior derecho. 
Resulta fácil comprobar que esta función satisface los cuatro axiomas de una 
función determinante de orden n. Por consiguiente, en virtud del teorema de 
unicidad, debe ser 


Análogamente se demuestra que det 
(3.15). 


r A Ol 

= det A. 

L o /J 

n- 


detB. Luego (3.16) implica 


3.11 Ejercicios 

1. Para cada una de las proposiciones siguientes relativas a matrices cuadradas, ■ 
demostración o poner un contraejemplo. 

a) det (A + B) = det A + det B. 

b) det {(A + B) 2 } = {det (A + B)}* 

c) det {(A + Bf} = det (A 2 + 2AB + B 2 ) 

d) det {(A + B) 2 } = det (A 2 + B 2 ). 


2. a) Extender el teorema 3.7 a matrices 
f A O 0~ 

O B O 
O O C 


con tres bloques diagonales: 

(det +)(det fi)(det Q. 


b) Establecer y dçmostrar una generalización del teorema para matrices con u 
cualquiera de bloques diagonales. 


Demostrar que det + = det 


"1 0 0 0" 


~a b c d~ 

0 10 0 

, B = 

e f s h 

a b c d 


0 0 10 

- e f S h l 


0 0 0 1_ 


c d 
_S h . 


y que det £ 


[~ a b 

_ e f- 
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4. Establecer y demostrar una generalización del ejercicio 3 para matrices nxn. 


5. Sea 



6 0 0 " 
d 0 0 
f g h 
y z w_ 


.Demostrar que det A 



6. Establecer y demostrar una generalización del ejercicio 5 para matrices nXn de la forma 



donde B, C, D son matrices cuadradas y O es una matriz de ceros. 

7. Aplicar el teorema 3.6 para determinar si los siguientes conjuntos de vectores son lineal- 
mente dependientes o independientes. 


a) A x = (1, -1,0), A 2 = (0,1, -1), A a = (2, 3, -1). 

b) Aj, = (1, -1,2, 1), A 2 = (-1,2, -1,0), A 3 = (3, -1, 1,0), A t = (1,0,0, 1). 

c) A x = (1,0, 0,0, 1), A 3 = (1,1,0, 0,0), A 3 = (1,0, 1,0, 1), A t = (1, 1,0, 1, 1), 
A s = (0,1,0,1,0). 


3.12 Fórmulas para desarrollar determìnantes. Menores y cofactores 

No hemos demostrado todavía la existencia de una función determinante, 
excepto en el caso 2X2. En esta sección utilizamos la linealidad y el teorema de 
unicidad para demostrar que, si existen determinantes, pueden calcularse mediante 
una fórmula que expresa cualquier determinante de orden n como una combi- 
nación lineal de determinantes de orden n — 1. La igualdad (3.2) de la sección 3.1 
es un ejemplo de esa fórmula en el caso 3X3. La fórmula general sugerirá un 
método para demostrar por inducción la existencia de funciones determinantes. 

Toda fìla de una matriz A, nXn, puede expresarse como una combinación 
lineal de los n vectores coordenados unidad Por ejemplo, la primera 

fila A x puede escribirse como sigue: 

A i=J,a lf Ij. 

í=i 

Puesto que los determinantes son lineales respecto a la primera fila tenemos 
(3.17) d(A lt A 2 , ...,AJ = d(fa u I it A 2 , ...,A n ^=fa u d^I^A^, ...,A n ). 
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Por consiguiente para calcular det A basta calcular d(7,- , A 2 , ■ ■ ■, A n ) para cada 
vector coordenado unidad /,-. 

Utilicemos la notación A\j para representar la matriz obtenida de A reempla- 
zando la primera íìla A x por el vector unitario /,-. Por ejemplo, si n = 3 existen 
tres matrices de ese tipo: 


L^31 ^32 6I33J 


Observemos que det A\j = í/(/,- ,A 2 ,..., A„) . La igualdad (3.17) puede ahora 
escribirse en la forma 


(3.18) det ^4 =2ai,det^í,. 

Ésta es una fórmula de desarrollo; y en ella se expresa el determinante de A 
como una combinación lineal de los elementos de su primera fila. 

E1 razonamiento udlizado para deducir (3.18) puede aplicarse a la fila k en 
lugar de hacerlo con la primera. E1 resultado es una fórmula de desarrollo en 
función de los elementos de la fila k. 

teorema 3.8. desarrollo por cofactores. Sea A'hj la matriz obtenida 
de la matriz A al sustituir la fila k de Ak por el vector coordenado unidad Ij. 
Se obtiene entonces la fórmula de desarrollo 

(3.19) det A =2 a ki d et 

que expresa el determinante de A como combinación lineal de los elementos de 
la fila k. El número det A’ kj se llama cofactor o adjunto del elemento a k j. 

En el teorema que sigue demostraremos que cada cofactor es, salvo el signo, 
igual al determinante de una matriz de orden n— 1 . Esas matrices se llaman 
menores. 

definición. Dada una matriz cuadrada A de orden n ^ 2, la matriz cua- 
drada de orden n— 1 obtenida suprimiendola fila k y la columna j de A se llama 
menor k,j de A y se designa por Akj. 

ejemplo. Una matriz A = (a k j) de orden 3 tiene nueve menores. Tres de 
ellas son 
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La igualdad (3.2) expresa el determinante de una matriz 3X3 como una 
combinación lineal de los determinantes de esas tres menores. La fórmula puede 
escribirse como sigue: 

det A = a n det A n — a 12 det A J2 + a 13 det A 1S . 


E1 siguiente teorema extiende esa fórmula al caso nXn para cualquier n ^ 2. 


TEOREMA 3.9. DESARROLLO POR LAS MENORES CORRESPONDIENTES A LA FILA 
k. Para cualquier matriz A, nXn, n ^ 2,el cofactor de a kj está relacionado con 
la menor A kj por la fórmula 

(3.20) det A' kj = (-1 f +i det A ki . 

Por consiguiente, el desarrollo del det A en función de los elementos de la fila k 
viene dado por la fórmula 


(3.21) 


det A =ì(~ 1 ) k+i a ki det A ki . 


Demostración. Consideremos primero el caso particular k = j = 1 . La ma- 
triz A' n tiene là forma 

" 1 0 0 • • • 0 _ 

° 2 i a 22 a 23 • • • a 2 „ 

.. a 31 a 32 a 33 ' ' ' a 3n 

A n = . . . 

_a nl a„ 2 a„ 3 • • • a„„_ 


Aplicando las operaciones elementales del tipo (3) a las fìlas, podemos convertir 
en ceros todos los elementos situados debajo del 1 en la primera columna, dejando 
invariables los demás elementos. Por ejemplo, si multipllcamos la primera fìla de 
Á n por — On y sumamos el resultado a la segunda fila, la nueva segunda fila será 
(0 ,a 22 ,a 23 ,..., a w ). Por medio de una sucesión de esas operaciones elementales 
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con las fîlas obtenemos una nueva matriz que designaremos con A° t y que tiene 
la forma 


'l 0 • • ■ 0 ' 

0 a 22 • • • a 2n 

0 a 32 a 3 „ 


|_0 a nì • • • a nn J 

Puesto que las operaciones con las filas del tipo (3) no modifìcan el determinante 
tenemos 

(3.22) det A n = det A'u. 

Pero A° t es un matriz diagonal en bloques, así que, en virtud del teorema 3.7, 
tenemos 


det A° n = det A n , 


siendo A n la menor 1,1 de A, 


a 22 ' ' ' a 2n 

a 32 ' ' • a 3 „ 


A n = 


Por consiguiente det A u = det A n , lo que demuestra (3.20) para k = / = 1. 

Consideremos seguidamente el caso particular k = 1, j cualquiera, y demos- 
tremos que 

(3.23) det A' u = (-l) 1 ” 1 det A u . 

Una vez demostrada (3.23) la fórmula (3.20) más general resulta inmediatamente, 
debido a que la matriz A' kj puede transformarse en una matriz de la forma B' u 
mediante k— 1 intercambios sucesivos de filas adyacentes. El- determinante cam- 
bia de signo en cada transposición, así que 


(3.24) 


det A' kj = (—l)* -1 det B' u , 
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siendo B una matriz nXn cuya primera fila es /,■ y cuya menor 1,/, B 1; -,es Akj. 
Según (3.23), tenemos 

det B' u = (-l) 1 '- 1 det B u = (-l) 3 ' 1 det A kj , 
con lo que (3.24) nos da 

det A' kj = (-l)*- 1 (-l) i - 1 det A kj = (-l)* +í det A kj . 

Por lo tanto si demostramos (3.23) también demostramos (3.20). 

Vamos ahora a demostrar (3.23). La matriz A' u tiene la forma 

0 • • • 1 • • • 0 ' 

«21 ' ' ‘ a 2i ' ' ' a ìn 

•^íí = . • 

-°nl ' ' * a ni ' ' ' a nn~ 

Mediante operaciones elementales con las filas del tipo (3) introduzcamos una 
columna de ceros debajo del 1 y la transformamos en 



Como antes, el determinante no varía, así que det A^ = det A' u . La matriz menor 
A t j tiene la forma 



Consideremos seguidamente el det A^ como una función de las n— 1 filas de A u , 
pongômos det A^ = f(A v ). La función / satisface los tres primeros axiomas de 
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una función determinante de orden n— 1 . Por consiguiente, según el teorema de 
unicidad podemos escribir 

(3-25) f(Aij) =f{J) det A u , 


en donde / es la matriz identidad de orden n— 1 . En consecuencia, para demos- 
trar (3.23) debemos demostrar que /(/) = (—IV -1 . Por definición /(/) escl deter- 
minante de la matriz 


C = 





Colunma j 


Fila j 


Los elementos situados en las líneas oblicuas son todos iguales a 1. Los res- 
tantes elementos no escritos son todos 0. Intercambiando la primera fila de C 
sucesivamente con las filas 2,3,... ,j llegamos a la matriz identidad I de orden 
nXn después de /—1 transposiciones. EI determinante cambia de signo en cada 
transposición, así que detC = ( —iy _1 . Luego /(/) = ( — IV -1 ', lo que demues- 
tra (3.23) y por tanto (3.20). 


3.13 Existencia de la función determinante 


En esta sección utilizamos la inducción respecto de n, que es el orden de la 
matriz, para demostrar la existencia de las funciones determinantes de cualquiei 
orden. Para n = 2 ya hemos demostrado que existe una función determinante. Para 
el caso n= 1 aceptamos por defìnición que det [í u j = a lt . 

Suponiendo que existe una función determinante de orden n—1, parece ló- 
gico que una función determinante de orden n fuera una de las fórmulas de 
desarrollo del teorema 3.9, por ejemplo, el desarrollo mediante las menores de la 
primera fila. No obstante, resulta más sencillo comprobar los axiomas si utilizamos 
una fórmula análoga expresada en función de las menores de la primera columna. 



Existencia de la función determinante 


111 


teorema 3.10. Supongamos la existencia de determinantes de orden n— 1. 
Para una matriz nXn cualquiera A = (a jk ), sea f la función definida por la 

(3.26) f(A lt ...,A n ) =Ì(-1 ) m fl„ det A n . 

Entónces f satisface los cuatro axiomas de una función determinante de orden n. 
Por consiguiente, por inducción, los determinantes de orden n existen para todo n. 

Demostración. Consideremos cada término de la suma (3.26) como una 
función de las filas de A y escribamos 

fi(Ai,, A n ) = (—l) i+1 a n det A n . 

Si comprobamos que cada /,■ satisface los axiomas 1 y 2 también / los satisfará. 

Multipliquemos la primera fila de A por un escalar t. Tal multiplicación no 
afecta a la menor Au puesto que ésta no incluye la primera fila. E1 coeficiente 
fln está multiplicado por t, así que tenemos 

fiitA^, A . A n ) = ta n det A n = tffA x ,... ,A n ). 

Si j > 1 la primera fila de cada menor A n queda multiplicada por t y el coeficiente 
a/i no queda afectado, por lo que otra vez tenemos 

fj(tA lt A 2 ,..., A n ) = tfj(A t , A 2 , ...,A n ). 

Por lo tanto.cada /,• es homogénea en la primera fila. 

Si se multiplica por t la fila k de A, siendo k > 1, la menor Aki no se modi- 
fica pero a^ queda multiplicado por t, por lo que fk es homogénea en la fila k. 
Si j # k, el coeficiente a^ no se afecta pero alguna fila de A n queda multiplicada 
por t. Luego toda /,• es homogénea en la fila k. 

Un razonamiento parecido demuestra que cada /, es aditiva respecto a cual- 
quier fila, por lo cual / satisface los axiomas 1 y 2. Seguidamente demostramos 
que / satisface el axioma V, la versión particular del axioma 3. Del teorema 3.1, 
se deduce entonces que / satisface el axioma 3. 

Para comprobar que / satisface el axioma 3', supongamos que sean iguales 
dos filas consecutivas de A, sean Ak = Ak+, . Entonces, excepto las menores Aki 
y Ak +lll , cada menor A }1 tiene dos filas iguales de modo que det A n = 0 . Por lo 
tanto la suma (3.26) consta tan sólo de los dos términos correspondientes a 
j = k y / = k + 1, 

(3.27) f(Aj ,...,A„)= (-1 )*+***! det A kl + (- l) fc + 2 fl fc+11 det A k+11 . 
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Pero^h = Ak +1 .i y a kl = a k+ltl ya que A k = A k+ i . Por consiguiente, los dos 
términos de (3.27) diíìeren tan sólo en el signo, por lo que f{A lt ..., A,) = 0. 
Así pues, / satisface el axioma 3'. 

Por último, comprobamos que / satisface el axioma 4. Cuando A = I tene- 
mos a n = 1 y a ;i = 0 para / > 1 . Asimismo, A lx es la matriz identidad de 
orden n— 1 , por lo cual cada término de (3.26) es cero salvo el primero, que 
es igual a 1 . Luego /(/, ,...,/„)= 1 por lo que / satisface el axioma 4. 

En la demostración anterior podría haberse muy bien utilizado una función / 
definida en función de las menores A /k de la columna k en lugar de las menores 
An de la primera columna. En efecto, si ponemos 

(3.28) f(A x ,...,A n ) = Ì(-l ) i+k a ík det A ik , 

exactamente el mismo íipo de demostración hace ver que esa / satisface los cua-- 
tro axiomas de una función determinante. Puesto que las funciones determinantes 
son únicas, las fórmulas de desarrollo (3.28) y las de (3.21) son todas iguales 
a detA. 

Las fórmulas (3.28) no sólo establecen la existencia de las funciones deter- 
minantes sino que también ponen de manifiesto un nuevo aspecto de la teoría de 
los determinantes — una conexión entre las propiedades relativas a filas y las 
propiedades relativas a columnas. Tal conexión se expone en la sección siguiente. 

3.14 Determinante de una matriz transpuesta 

Asociada a cada matriz A se considera otra matriz llamada transpuesta de A 
y designada por A‘. Las filas de A‘ son las columnas de A. Por ejemplo, si 



Una definición formal puede darse así: 

definición de transpuesta. La transpuesta de una matriz, mXn, 
A = (úTy)”^! es la matriz, nXm, A* cuyo elemento i,j es aa. 

Si bien la transposición puede aplicarse a cualquier matriz rectangular nos 
referiremos en primer lugar a las matrices cuadradas. A continuación demostramos 
que la transposición de una matriz cuadrada no modifica su determinante. 
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teorema 3.11. Para toda matriz A, nXn, tenemos 
det A = det^ 4 . 

Demostración. Se demuestra por inducción en n. Para n = 1 y n = 2 el 
resultado se comprueba inmediatamente. Supongamos, entonces, que el teorema es 
cierto para matrices de orden n — 1 . Sean A = ( ûì ,) y B u = A* = ( 6 i; -) . Desarro- 
llando det A por sus menores correspondientes a la primera columna y det B por 
sus menores relativos a la primera fila tenemos 

det A = Ì(-l y +1 a n det A n , det B = î(-l) í+ % det B u . 

Pero por la definición de transpuesta tenemos b xj = a jx y B l} = (A jx y. Puesto que 
hemos supuesto que el teorema es cierto para matrices de orden n— 1 tenemos 
det Bìj = det A jx . Luego las sumas anteriores coinciden término a término, con 
lo que det A = det B . 

3.15 La matriz cofactor 

E1 teorema 3.5 puso de manifiesto que si A es no singular.det A ¥= 0. E1 teore- 
ma siguiente demuestra el recíproco. Esto es, si det A¥^ 0, existe A* 1 . Además, 
da una fórmula para expresar A -1 en función de una matriz formada con los 
cofactores de los elementos de A. 

En el teorema 3.9 se demostró que el cofactor de a tj es igual a ( — l) i+l det A, ; , 
siendo A, ; - la menor i,j de A. Designemos ese cofactor por cof a,y. Así pues, por 
definición, 


cof a i} = (-l) i+í det/f, ; . 

definicion de matriz cofactor. La matriz cuyo elemento i,j es cof a i; se 
llama la matriz cofactor de A (*) y se designa por cof A. Así pues, tenemos 


cof A = (cof a ti )î J= i = ((—1) <+Í det A tí )“ í=1 . 

E1 teorema que sigue demuestra que el producto de A por la transpuesta de 
su matriz cofactor es, salvo un factor escalar, la matriz identidad /. 


(*) En la literatura sobre matrices, especialmente en los tratados clásicos, la transpuesta 
de la matriz cofactor se llama adjunta de A. No obstante, la nomenclatura actual reserva la 
palabra adjunta para otra cosa completamente distinta, que se discutirá en la sección 5.8. 
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teorema 3.12. Para cualquier matriz A, nXn, con n ^ 2 tenemos 
(3.29) A(coî AY = {àet A)I. 

En particular, si det A^O existe la inversa de A y viene dada por 

A~ l = —— (cof A)t. 
det A v 

Demostración. Utilizando el teorema 3.9 expresamos det A en función de 
sus cofactores relativos a la fìla k por la fórmula 


(3.30) det A = ï<*icj cof a kj . 

Mantengamos fija k y apliquemos esta relación a una nueva matriz B cuya fila i 
es igual a la fila k de A para alguna / # k, y cuyas filas restantes son las mismas 
que las de A . Entonces det 6 = 0 debido a que las filas i y k de B son iguales. 
Expresando det B en función de sus cofactores relativos a la fila i tenemos 

(3.31) det B = Jj b u cof b u = 0 . 

Pero ya que la fila i de B es igual a la fila k de A tenemos 

b H = a kj y cof b 4j = cof a iS . para cualquier j. 

Luego (3.31) establece que 

(3.32) %a kj cof a {J = 0 si k 7 * i. 


Las igualdades (3.30) y (3.32) pueden escribirse conjuntamente así: 

(3.33) îa, lC oU ll -^ A - ' = ‘ 

Pero la suma que aparece en el primer miembro de (3.33) es el elemento k,i 
del producto A(cof Af . Por consiguiente (3.33) implica (3.29). 


Como corolario directo de los teoremas 3.5 y 3.12 tenemos la siguiente con- 
dición necesana y suficiente para que una matriz cuadrada sea no singular. 
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teorema 3.13. Una matriz cuadrada A es no singular si y sólo si det A 0 . 

3.16 Regla de Cramer 

E1 teorema 3.12 puede también utilizarse para resolver un sistema de ecua- 
ciones lineales con matriz no singular. Las fórmulas que se obtienen constituyen 
la llamada regla de Cramer, en memoria del matemático suizo Gabriel Cramer 
(1704-1752). 

teorema 3.14. regla de cramer. Si un sistema de n ecuaciones lineales 
con n incógnitas x,,... ,x n , 


(3.34) Ì a ijXj = b t (i = 1, 2. n) 

tiene la matriz de los coeficientes A = (a./) no singular, existe una solución única 
para el sistema dada por las fórmulas 

x ' = d ^jZ i ’‘ coffl *i> para J=U2,...,n. 

Demostración. E1 sistema se puede poner en forma matricial 


en donde X y B son matrices columna, X = 


. Puesto que A 


es no singular existe una solución única X dada por 

(3.35) X = A~'B = —(cof A)*B. 

det A 

Las fórmulas (3.34) se obtienen igualando los componentes en (3.35). 

Debe observarse que la fórmula para x,- en (3.34) se puede expresar como 
cociente de dos determinantes. 


Xj = 


det Cj 
det A 
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en donde C, es la matriz obtenida de A al reemplazar la columna / de A por la 
matriz columna B. 


3.17 Ejercicios 

1. Determinar la matriz cofactor de cada una de las matrices siguientes: 



2. Determinar la inversa de cada una de las matrices no singulares del ejercicio 1. 

3. Hallar todos los valores del escalar X para los que la matriz X/ — A es singular, si A 
es igual a 


r ° 3 ] 

‘l 0 2 


' 11 -2 8 ' 

l -J’ b> 

0 -1 -2 

- 2 "2 0 _ 

, c) 

19 -3 14 

-8 2 —5_ 


4. Si A es una matriz nXn con n > 2, demostrar cada una de las propiedades de su ma- 
triz cofactor: 

a) cof (A') = (cof a)•. b) (cof A)'A = (det A)I . 

c) A(cof A)‘ = (cof A)‘A (A es permutable con la transpuesta de su matriz cofactor). 

5. Resolver mediante la regla de Cramer cada uno de los sistemas que siguen: 

a) x + 2y + 3z =$, 2x — y + 4z = 7, —y + z = 1. 

b) x + y + 2z = 0, 3x - y - z = 3, 2x + 5y +3z =4. 

6. a) Justificar que cada una de las ecuaciones que siguen es la ecuación cartesiana de 
una recta, en el plano xy, que pasa por los puntos (x u y,) y (x 2 , y 2 ). 



X 

y i' 

^"^1=0; det 


yi i 

lx 2 -xi y 2 -y J 


yt i. 


b) Establecer y demostrar relaciones análogas, en el espacio de tres dimensiones, para 
un plano que pasa por tres puntos. 

c) Establecer y demostrar relaciones análogas en el plano xy para una circunferencia 
que pasa por tres puntos no alineados. 
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Dadas n 1 funciones f„ cada una derivable en un intervalo (a, b), definir F(x) = 
= det [/i/(x)] para cada x en (a, S). Demostrar que la derivada F'(x) es una suma de 
n determinantes. 


=Ìdet A { (x), 


donde A ( (x) es la matriz que se obtiene derivando las funciones de la fila i de [/i,(x)] . 
Una matriz nxn de funciones de la forma W(*) = [k,(‘ _1 )(x)], en la que cada fila 
después de la primera es la derivada de la fila anterior, se llama matriz wronskiana en 
recuerdo del matemático polaco J. M. H. Wronski (1778-1853). Demostrar que la derivada 
del determinante de W(x) es el determinante de la matriz obtenida derivando cada uno 
de los elementos de la última fila de W(x). 

[ Indicación: Utilizar el ejercicio 7.] 
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AUTOVALORES Y AUTOVECTORES 


4.1 Transfonnaciones lineales representadas mediante matrices diagonales 

Sea T: V V una transformación lineal en un espacio lineal V de dimensión 
finita. Las propiedades de T que son independientes de cualquier sistema de coor- 
denadas (base), se denominan propiedàdes intrínsecas de T. Si se puede elegir una 
base de manera que la matriz resultante tenga una forma especialmente sencilla, 
existe la posibilidad de reconocer algunas de las propiedades directamente a partir 
de la representación matricial. 

Entre los tipos sencillos de matrices están las diagonales. Cabe entonces pre- 
guntarse si toda transformación lineal puede representarse mediante una matriz 
diagonal. En el capítulo 2 se trató el problema de hallar una representación en 
matriz diagonal de una transformación lineal T:V~*W, siendo dim V = n y 
dim W = m. En el teorema 2.14 se demostró que siempre existe una base 
(<?i,..., e„) para V y otra (tVi,..., w m ) para W tales que la matriz de T en re- 
lación a este par de bases es una matriz diagonal. En particular, si W = V la 
matriz será cuadrada. Ahora se trata de utilizar Ia misma base para V y W. Con 
esta restricción no siempre es posible encontrar una representación de T en matriz 
diagonal. Abordemos, entonces, el problema de determinar qué transformaciones 
tienen una representación en matriz diagonal. 

Notación: Si A = (a„) es una matriz diagonal escribimos A = diag (a u , a a , ■ ■ ■, a m ). 

Es sencillo establecer una condición necesaria y sufìciente para que una trans- 
formación lineal tenga una representación en matriz diagonal. 

teorema 4.1. Dada una transformación T:V~>V, donde dim V = n. 
Si T tiene una representación en matriz diagonal, existe entonces un conjunto de 
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elementos independientes u x ,..., u„ de V y un correspondiente conjunto de esca- 
lares \ L ,..., K tales que 

(4.1) T(u k ) = X k u k para k = 1,2. n. 

Recíprocamente, si existe un conjunto independiente u k ,... ,Un en V y un con- 
junto correspondiente de escalares ,... ,K que satisfacen (4.1), entonces la 
matriz 


A = diag^. X n ) 

es una representación de T resipecto a la base (u L ,..., u n ). 

Demostración. Supongamos primero que T tiene una representación en ma- 
triz diagonal A = (aik) con respecto a la base (e L ,... ,e„). La acción de T sobre 
los elementos de la base viene dada por la fórmula 

T (e k ) = È a a*t = a kk«k 

puesto que a t k = 0 para i # k . Esto demuestra (4.1) con u k = e k y K = a k k. 

Supongamos ahora que existen los elementos independientes u L ,... ,u„ y 
los escalares k L ,... ,X„ que satisfacen (4.1). Puesto que u L ,... ,u„ son indepen- 
dientes, constituyen una base para V. Si definimos a kk = K y a ik = 0 para i ¥= k, 
entonces la matriz A = (a ik ) es una matriz diagonal que representa T con res- 
pecto a la base (u L ,... ,tu). 

Así pues.el problema de hallar una representación en matriz diagonal de una 
transformación lineal se ha reducido a otro, el de hallar los elementos indepen- 
dientes u L ,..., u„ y los escalares A* ,..., A* que satisfagan (4.1). Tales elemen- 
tos u k y escalares X k se llaman autovectores o vectores propios y autovalores de T, 
respectivamente. En la sección siguiente estudiamos los autovectores y autovalo- 
res (*) en un aspecto más general. 

4.2 Autovectores y autovalores de una transformación lineal 

En esta discusión, V representa un espacio lineal y S un subespacio de V. Los 
espacios S y V no han de ser necesariamente de dimensión finita. 


(*) Las palabras autovector y autovalor son las traducciones de las palabras alemanas 
Eigenvektor y Eigenwert. Algunos autores emplean los términos vector característico, o vector 
propio como sinónimos de autovector. Los autovalores también se llaman valores caracterís- 
ticos o propios. 






Autovectores y autovalores de una transformación lineal 121 

definición. Sea T: S V una transformación de S en V. Un escalar X se 
denomina autovalor de T si existe un elemento no nulo x en S tal que 

( 4.2) T(x) = Xx. 

El elemento x se llama autovector de T perteneciente a X. El escalar X se llama 
autovalor correspondiente a x . 

Existe un solo autovalor correspondiente a un autovector dado x. En efecto, 
si tenemos T(x) = A* y T(x) = fix para un cierto x O , entonces Ax = p.x con 
lo que A = /a . 


Observación: Si bien la ecuación (4.2) siempre es válida para x = O y cual- 
quier escalar X, la aefmicián excluye O como autovector. Esto se justifica por tener 
que existir un solo autovalor X asociado a un autovector dado x. 

Los ejemplos siguientes ponen de manifiesto el significado de esos conceptos. 

ejemplo 1. Multiplicación por un escalar fijado. Sea T: S -* V la trans- 
formación lineal definida por la ecuación T( x) = cx para cada x de S, siendo c 
un escalar fijado. En este ejemplo todo elemento no nulo de S es un autovector 
perteneciente al escalar c. 

ejemplo 2. El autoespacio E(A) que consta de todos los x tales que 
T(x) = Xx. Sea T: S V una transformación lineal que tiene un autovalor A, 
Sea E(X) el conjunto de todos los elementos x de S tales que T(x) = Xx . Este con- 
junto contiene el elemento O y todos los autovectores pertenecientes a X. Es fácil 
demostrar que E(X) es un subespacio de S, porque si x e y están en E(X) tenemos 

T(ax + by) = aT(x) + bT(y) = aXx + bXy — X(ax + bý) 

para todos los escalares a y b. Luego (ax + by) e E(X) así que E(X) es un sub- 
espacio. E1 espacio E(X) se llama autoespacio correspondiente a X . Puede ser de 
dimensión finita o infinita. Si E(X) es de dimensión finita entonces dim E(X) ^ l, 
ya que E(X) contiene por lo menos un elemento x no nulo correspondiente a X . 

ejemplo 3. Existencia de autovalores cero. Si existe un autovector no 
puede ser cero, por defìnición. Sin embargo, el escalar cero puede ser un auto- 
valor. En efecto, si 0 es un autovalor para x entonces T(x) = 0 x = O, por lo que 
x es del núcleo de T. Recíprocamente, si el núcleo de T contiene elementos no 
nulos cada uno de ésos es un autovector con autovalor 0. En general, E(X) es 
el núcleo de T — XI. 


ejemplo 4. Reflexión en el plano xy. Sea S = V = V 3 (R) y sea T una 
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reflexión en el plano xy. Esto es, T actúa sobre los vectores bases i, j, k de la si- 
guiente manera: T(i) — i, T(f) = j, T(k) = —k. Cada vector no nulo en el 
plano xy es un autovector con un autovalor 1. Los autovectores restantes son de 
la forma ck, donde c ¥= 0; cada uno de ellos tiene el autovalor — 1. 

ejemplo 5. Rotación del plano. Este ejemplo es particularmente intere- 
sante porque pone de manifiesto que la existencia de autovectores puede depender 
del cuerpo fundamental de escalares. E1 plano puede considerarse como un espacic 
lineal de dos maneras distintas: 1) como un espacio lineal real de dimensión 2, 
V = V 2 (R), con dos elementos base (1,0) y (0,1), y con números reales como 
escalares; o 2) como un espacio lineal complejo de dimensión 1, V = Vi(C), con 
un elemento base 1, y los números complejos como escalares. 

Consideremos primero la segunda interpretación. Cada elemento z # 0 de 
Vi(C) se puede expresar en forma polar, z = re w . Si T imprime a z un giro de 
ángulo a entonces T(z) = re i(e+a) = e ia z . Así pues, cada z # 0 es un autovector 
con autovalor \ = e ia . Obsérvese que el autovalor e ia no es real a menos que x 
sea un múltiplo entero de tt . 

Consideremos ahora el plano como un espacio lineal real, V 2 (R). Puesto que 
los escalares de V 2 (R) son números reales, la rotación T admite autovalores reales, 
únicamente si a es un múltiplo entero de v . Dicho de otro modo, si a no es múl- 
tiplo entero de ir entonces T no tiene autovalor.es reales y por tanto tampocc 
autovectores. De esto resulta claro que la existencia de autovectores puede de- 
pender de la elección de los escalares para V. 

ejemplo 6. El operador derivada. Sea V el espacio lineal de todas las fun- 
ciones reales / que admiten derivadas de cualquier orden en un intervalo abierto 
dado. Sea D la transformación lineal que aplica cada / en su derivada, D(f) = f . 
Los autovectores de D son aquellas funciones / no nulas que satisfacen una ecua- 
ción de la forma 


/' = ¥ 

para un cierto número real A. Ésta es una ecuación diferencial lineal de primer 
orden. Todas 'sus soluciones vienen dadas por la fórmula 

f(x) = ce Xx , 


donde c es una constante real arbitraria. Por consiguiente, los autovectores de D 
son todas las funciones exponenciales f(x) = ce kx con c¥= 0 . E1 autovalor corres- 
pondiente a f(x) = ce kx es A. En ejemplos como éste, en los que V es un espacio 
funcional. los autovectores se llaman autofunciones. 
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ejemplo 7. El operador integración. Sea V el espacio lineal de todas las 
funciones continuas en un intervalo finito [a, &]. Si / e V, designemos por g=T(f) 
a la función dada por 


g(x) = j*f(t) dt si a<,x<,b. 

Las autofunciones de T (si existen) son aquellas / no nulas que satisfacen una 
ecuación de la forma 

(4.3) J*/(t) dt = Xf(x) 

para algún valor real A. Si existe una autofunción podemos derivar esta 
ecuación para obtener la relación f(x) = A f(x), de la cual encontramos 
f(x) = ce x/x , con tal que A # 0. Dicho de otro modo, las únicas autofunciones 
posibles son aquellas funciones exponenciales de la forma f(x) = ce® /x con c¥= C 
y A ¥= 0. No obstante, si ponemos x = a en (4.3) obtenemos 

0 = A/(a) = Xcef‘ /i . 

Puesto que e a/x nunca es cero, vemos que la ecuación T(f) = A f no puede satis 
facerse con una / no nula, así que T no tiene autofunciones ni autovalores. 

EjEMPLO 8. Subespacio engendrado por un autovector. Sea T: S V una 
transformación lineal que tiene un autovalor A. Sea x un autovector perteneciente 
a A y sea L(x) el subespacio engendrado por x. Esto es, L(x) es el conjunto de 
todos los productos de x por escalares. Es fácil demostrar que T aplica L(x) en sí 
mismo. En efecto, si y = cx tenemos 

T(y) = T(cx) = cT(x) = c(Xx) = X(cx) = Xy. 

Si c ¥= 0 entonces y¥= O por lo que todo elemento no nulo y de L(x) es también 
un autovector perteneciente a A. 

Se dice que un subespacio U de S es invariante en la transformación T, si 
ésta aplica cada elemento de U en otro elemento de U. Acabamos de demostrar 
que el subespacio engendrado por un autovector es invariante en T. 

4.3 Independencia lineal de autovectores correspondientes a autovalores distintos 

Una de las propiedades más importantes de los autovalores es la que se 
expone en el teorema siguiente. Como antes, S representa un subespacio de un 
sspacio lineal V. 
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teorema 4.2. Si ui,... ,Uk son autovectores de una transformación lineal 
T:S V, y los autovalores X,,. . .,À* son distintos, entonces los autovectores 
Ui,..., Uk son independienter. 

Demostración. La demostración es por induccíón en k. E1 resultado es 
trivial cuando k = 1. Supongamos, entonces, que ha sido demostrado para cual- 
quier conjunto de k— 1 autovectores. Sean « x , ... ,Uk,k autovectores pertenecien- 
tes a autovalores distintos, y supongamos que existen escalares c; tales que 

(4.4) ; Ỳ CfUt = O. 

Aplicando T a los dos miembros de (4.4) y utilizando el hecho de que 
T(Ui ) = Kui encontraiqos 

(4.5) 2 c ÁUi = 0. 

Multiplicando (4.4) por A* y restando de (4.5) obtenemos la ecuación 


2 c t(^< — h) u i = O. 


Pero ya que Uk-i son independientes,debe ser Ci(A,- — A.*) = 0 para cada 

i = 1 , 2, ... , k — 1 . Puesto que los autovalores son distintos tenemos K ¥* 
para i ¥= k así que c,- = 0 para i — 1, 2, ..., k — 1. En virtud de (4.4) vemos 
que Ck es también 0, por lo que los autovectores u lt ... ,Uk son independientes 

Obsérvese que el teorema 4.2 no sería cierto si el elemento cero pudiera ser 
un autovector. Ésta es otra razón para excluir O como autovector. 

Advertencia: E1 recíproco del teorema 4.2 no es cierto. Esto es, si T tiene 
autovectores independientes Ui.... ,u t , entonces los correspondientes autovalores 
Ai,..., Xí no son necesariamente distintos. Por ejemplo, si T es la transformación 
idéntica, T(x) = x para todo x, entonces todo r/O esun autovector, pero existe 
sólo un autovalor, X = 1. 

E1 teorema 4.2 tiene consecuencias importantes en el caso de dimensión 
finita. 

teorema 4.3. Si dim V = n, toda transformación lineal T: V -> V tiene 
por lo menòs n autovalores distintos. Si T tiene exactamente n autovalores distin- 
tos, entonces los autovectores correspondientes forman una base para V y la 
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matriz de T relativa a esa base es una matriz diagonal con los autovalores como 
elementos diagonales. 

Demostración. Si existieran n + 1 autovalores distintos, entonces, según el 
teorema 4.2, V contendría n + 1 elementos independientes. Esto no es posible 
puesto que dim V = n. La segunda aíìrmación se deduce de los teoremas 4.1 y 
4.2. 


Observación: E1 teorema 4.3 nos dice que la existencia de n autovalores distintos 
es una condición suficiente para que T tenga una representación en matriz diagonal. 
Esta condición no es necesaria. Existen transformaciones lineales con menos de n auto- 
valores distintos que pueden representarse mediante matrices diagonales. La transfor- 
mación identidad es un ejemplo. Todos sus autovalores son iguales a 1 pero puede re- 
presentarse por la matriz identidad. E1 teorema 4.1 nos dice que la existencia de n 
autovalores independientes es necesaria y suficiente para que T admita una representa- 
ción en matriz diagonal. 


4.4 Ejercicios 

1. a) Si T tiene un autovalor X, demostrar que aT tiene el autovalor a\. 

b) S» x es un autovector para T, y T 2 demostrar que también lo es para aT i + bTi. 
iCómo están relacionados los autovalores? 

2. Supongamos que T: V-* V tiene un autovector x perteneciente a un autovalor X. De- 
mostrar que x es un autovector de T 2 perteneciente a X 2 y, con mayor generalidad, x es 
un autovector de T" perteneciente a X". Utilizar luego el resultado del ejercicio 1 para 
demostrar que si P es un polinomio, entonces x es un autovector de P(T) perteneciente 
a E(X). 

3. Consideremos el plano como un espacio lineal real, V = V 2 (R), y sea T un giro de V 
de ir/2 radianes. Si bien T no tiene autovectores, demostrar que todo vector no nulo 
es un autovector de T 2 . 

4. Si T: V —» V tiene la propiedad de que T 2 tiene un autovalor no negativo X 2 , demostrar 
que por lo menos uno de los dos valores X o — X es un autovalor para T. 

■ [Indicación: T 2 - X7 = (T + \I)(T - X/).] 

5. Sea V el espacio Iineal de todas las funciones reales derivables en (0,1). Si f 6 V, defi- 
namos g = T(f) poniendo g(t) = tf'(t) para todo t en (0,1). Demostrar que todo X real 
es un autovalor de T, y determinar las autofunciones correspondientes a X. 

6. Sea V el espacio lineal de todos los polinomios reales p(x) de grado < n. Si p E V, defi- 
namos q = T(p) poniendo q(t) = p(t + 1) para todo t real. Demostrar que T tiene sola- 
mente el autovalor 1. iCuáles son las autofunciones pertenecientes a ese autovalor? 

7. Sea V el espacio lineal de todas las funciones continuas en (— oo,+oo) y tales que la 
integral f(t)dt existe para todo x real. Si / 6 V definamos g = T(f) poniendo 
g(x) = {-ca f(t)dt. Demostrar que todo X positivo es un autovalor para T y determinar 
las autofunciones correspondientes a X. 

8. Sea V el espacio lineal de todas las funciones continuas en ( — oo, +oo) y tales que la 
integral J1 „ t f(t)dt exista para todo x real. Si f 6 V definamos g = T(f) poniendo 
g(x) = J!L co tf(t)dt. Demostrar que todo X negativo es un autovalor para T y determinar 
las autofunciones correspondientes a X. 
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9. Sea V = C(0, tt) el espacio lineal real de todas las funciones reales continuas en el in- 
tervalo [0, tt]. Sea S el subespacio de todas las funciones f que admiten derivada se- 
gunda continua y que satisfacen también las condiciones de contomo /(0) = f(ir) = 0. 
Sea T: S —>V la transformación lineal que aplica cada f en su derivada segunda, 
T(f) = f". Demostrar que los autovalores de T son los números de la forma — n 1 , 
donde n = 1,2,..., y que las autofunciones correspondientes a — n 1 son f(t) = c„ sen nt, 
siendo c„ ^ 0 . 

10. Sea V el espacio lineal de todas las sucesiones convergentes {*„}. Defmamos T: V —> V 
del modo siguiente: Si x = {x„} es una sucesión convergente con límite a, T(x) = {y„}, 
siendo y„ = a — x„ para n > 1. Demostrar que T tiene sólo dos autovalores, X = 0 y 
X = — 1, y determinar los autovectores pertenecientes a cada uno de esos X. 

11. Supongamos que una transformación lineal T tiene dos autovectores x e y pertenecien- 
tes a autovalores distintos X y /t. Si ax + by es un autovector de T, demostrar que 
a = 0 o b = 0. 

12. Sea T: S —>V una transformación lineal tal que todo elemento no nulo de S es un 
autovector. Demostrar que existe un escalar c tal que T(x) = cx. Dicho de otro modo, 
la única transformación con esta propiedad es el producto de la identidad por un 
escalar. [ Indicación: Hacer uso del ejercicio 11.] 


4.5 Caso de dimensión finita. Polinomios característicos 

Si dim V = n, el problema de determinar los autovalores de una transforma- 
ción lineal T: V V puede resolverse con la ayuda de los determinantes. Desea- 
mos hallar aquellos escalares A. tales que la ecuación T(x) = \x tenga una solución 
x # O. La ecuación T(x) = Xx puede escribirse en la forma 

(XI — T)(x) = O, 

donde I es la transformación identidad. Si ponemos T x = À/ — T, entonces A es 
un autovalor si y sólo si la ecuación 

(4.6) T x (x) = O 

tiene una solución x no nula, en cuyo caso T x no es invertible (en virtud del 
teorema 2.10). Por consiguiente, según el teorema 2.20, una solución no nula de 

(4.6) existe si y sólo la matriz de T x es singular. Si A es una representación ma- 
tricial de T, entonces \I — A es una representación matricial para T x . Según el 
teorema 3.13, la matriz XI — A es singular si y sólo si det (A/ — A) = 0. Así pues, 
si A es un autovalor para T debe satisfacer la ecuación 

(4.7) det (XI — A) = 0. 

Recíprocamente, cualquier A del cuerpo fundamental de escalares que satisfaga 

(4.7) es un autovalor. Esto sugiere que el determinante det (A/ — A) debería estu- 
diarse como una función de A. 
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teorema 4.4. Si A es una matriz nXn cualquiera e I es la matriz identi- 
dad nXn, entonces la función f definida por la ecuación 

f(X) = det (iII - A) 

es un polinomio en A de grado n. Además, el término de mayor grado es A”, y el 
término independiente o constante es /(0) = det(— A) = ( — 1)” det A. 

Demostración. La afìrmación /(0) = det (—>1) resulta inmediatamente de 
la definición de /. Vamos a demostrar que / es un polinomio de grado n única- 
mente para el caso n ^ 3. La demostración en el caso general puede hacerse por 
inducción y la dejamos como ejercicio. (Ver ejercicio 9 de la sección 4.8.) 

Para n = 1 el determinante es el polinomio lineal /(A) = A. — a u . Para 
n = 2 tenemos 

A — a n —a 12 

det (A/ — A) = \ = (A - a u )(A - a 22 ) - a 12 a 21 

| — a n A — a 22 1 

= A® — (a u + a 22 )A + (a u a 22 — a 12 a 21 ), 
polinomio de segundo grado en A. Para n= 3 tenemos 
A - a u — a 12 — a 18 

det (A/ — +) = —a 21 A — a 22 —a^ 

—a 31 — a 32 A — a 33 

. I A — a 22 —a 23 I I —a 21 —a 23 I I —a 21 A — a 22 1 

= (A - a u ) + a 12 - a 13 

| a 32 a a 33 1 | — a 31 A — a 33 1 | — a 31 — a 32 | 

Los dos últimos términos son polinomios de primer gradô en A. El primer término 
es un polinomio de tercer grado, siendo el término de mayor grado A 3 . 

definición. Si A es una matriz nXn el determinante 
/(A) = det (XI - A) 

se denomina polinomio característico de A. 

Las raíces del polinomio característico de A son números complejos, alguno 
de los cuales puede ser real. Si designamos con F el campo real R o el campo 
complejo C, tenemos el teorema siguiente. 
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teorema 4.5. Sea T:V -> T una transformación lineal, siendo F el campo 
de escalares de V, y dim V—n. Sea A urta representación matricial de T. Entonces 
el conjunto de autovalores de T consta de aquellas raíces del polinomio caracte- 
rístico de A que pertenecen a F. 

Demostración. La discusión del teorema 4.4 pone de manifiesto que todo 
autovalor de T satisface la ecuación det (AJ — A) = 0 y que cualquier raíz del 
polinomio característico de A que pertenece a F es un autovalor de T. 

La matriz A depende de la elección de la base para V, pero los autovalores 
de T se definieron sin hacer referencia a una base. Por consiguiente, el conjunto de 
raíces del polinomio característico de A debe ser independiente de la elección de 
la base. Más aún, en una sección posterior demostraremos que el mismo polinomio 
característico es independiente de la elección de base. Volvamos ahora al problema 
de calcular los autovalores y autovectores en el caso de dimensión finita. 

4.6 Cálculo de autovalores y autovectores en el caso de dimensión finita 

En el caso de dimensión finita los autovalores y autovectores de una trans- 
formación lineal T se llaman también autovalores y autovectores de la representa- 
ción matricial de T. Así pues, los autovalores de una matriz cuadrada A son las 
raíces del polinomio característico /(X) = det (X/ — A). Los autovectores corres- 
pondientes a un autovalor X son aquellos vectores no nulos X = (x a ,..., x„) 
considerados como matrices columna nXl que satisfacen la ecuación matricial 


AX = ÀX, o (XI - A)X = O. 

Éste es un sistema de n ecuaciones lineales para los componentes ,... ,x n . 
En cuanto se conoce X podemos obtener los autovectores resolviendo ese sistema. 
Seguidamente ofrecemos tres ejemplos que presentan aspecto distinto. 


ejemplo 1. Una matriz con todos sus autovalores distintos. La matriz 


A 


tiene el polinomio característico 



r 

4 

-2 


det (X/ - A) = det 


'X — 2 -1 

-2 A — 3 
1 1 


= (X- l)(A + l)(A-3), 
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con lo que existen tres autovalores distintos: 1, —1 y 3. Para hallar los autovec- 
tores correspondiente a ^ = 1 resolvemos el sistema AX = X, o 


' 2i r 

"* j " 


v 

2 3 4 

*2 

= 

x 2 

-1 -1 —2 

+ 3 . 




Esto nos da 

2*! + * 2 + x 3 = x t 
2x x + 3x 2 + 4 x 3 = * 2 

—*i — x 2 — 2*3 = * 3 , 
que podemos escribir en la forma 

*i + x 2 + * 3 = 0 

2*! + 2* 2 + 4*3 = 0 

—*1 — *2 — 3 * 3 = 0 . 

Sumando las ecuaciones primera y tercera encontramos * 3 = 0, y las tres ecua- 
ciones se reducen entonces a *, + x 2 = 0. Con lo cual, los autovectores corres- 
pondientes a A = 1 son X = f(l, —1,0), siendo t cualquier escalar no nulo. 

Mediante cálculos parecidos encontramos los autovectores X = í(0,1,-1) 
correspondientes aA = — 1, y X = t(2,3, —1) correspondientes a A = 3, siendo 
t un escalar cualquiera no nulo. Puesto qúe los autovalores son distintos los auto- 
vectores correspondientes (1,—1,0), (0,1,—1) y (2,3,-1) son independien- 
tes. Los resultados pueden resumirse en forma de tabla de la manera siguiente. 
En la tercera columna se consigna la dimensión del autoespacio £(A). 


Autovalor A Autovectores dim E(A) 


1 /(1, —1,0), í^0 1 

-1 t(0, 1,-1), t* 0 1 

3 t(2, 3, — 1), tjt 0 1 


ejemplo 2. Una matriz con autovalores repetidos. La matriz 


'2 -i r 
0 3-1 

2 1 3 
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tiene el polinomio característico 


det (XI - A) = det 


7-2 

0 


= (a - m - m - 4 ). 


Los autovalores son 2, 2 y 4. (Citamos el autovalor 2 dos veces para destacar 
que es una raíz doble del polinomio característico.) Para encontrar los autovecto- 
res correspondientes a X = 2 resolveremos el sistema AX = 2X, que se reduce a 

—x 2 + x 3 = 0 
x 2 — x 3 = 0 
2xj + x 2 + x 3 = 0. 


Éste tiene la solución x 2 = x 3 = — x^ con lo que los autovectores correspondien- 
tes a A = 2 son t( — 1, 1, 1), donde t ¥= 0. Análogamente encontramos îos auto- 
vectores í(l, —1, 1) correspondientes al autovalor A = 4. La tabla resumen es la 
siguiente: 


Autovalor A 

Autovectores 

dim E( A) 

2,2 

/(—1,1,1), t¥ 0 

1 

4 

í(l,-1,1), t¥ 0 

1 


ejemplo 3. Otra matriz con autovalores repetidos. La matriz 


A 


‘2 i r 

2 3 2 

3 3 4 


tiene el polinomio característico (A — 1)(A — 1)(A — 7). Cuando A = 7 el síste- 
ma AX = IX se 'convierte 


5^ — x 2 — jc 3 = 0 
-2x x + 4x 2 - 2x 3 = 0 
-3x x - 3x 2 + 3x a = 0. 

Éste tiene-la solución x 2 = 2x x ,x 3 = 3x ly así que los autovectores correspondien- 
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tes a A = 7 son í(l,2, 3), donde t¥=0. Para el autovalor-A. = 1, el sistema 
AX — X consta de la ecuación 


+ x 2 + x 3 = 0 

repetida tres veces. Para resolver esta ecuación podemos tomar x, = a, x 2 = b, 
donde a y b son arbitrarios, y tomamos entonces x 3 = — a — b. Así, todo auto- 
vector correspondiente a A = 1 tiene la forma 

(a, b, —a — b) = a( 1,0, -1) + b( 0,1,-1), 


siendo a 0 o b ¥= 0. Esto significa que los vectores (1,0, —1) y (0,1, — 1) 
forman una base para E(l). Luego dimE(A) = 2 cuando A = 1. Los resultados 
pueden resumirse así: 

Autovalor Autovectores dim E( A) 

7 /(1,2,3), /?í0 1 

1,1 a(\, 0, — 1) + ì(0,1, — 1), a, b no ambos 0. 2 

Obsérvese que en este ejemplo existen tres autovectores independientes pero sola- 
mente dos autovalores distintos. 

4.7 Traza de una matriz 

Sea /(A) el polinomio característico de una matriz A, nXn. Designemos las 
n raíces de /(A) por A,,..., A„, repitiendo cada raíz múltiple las veces que indi- 
que su orden de multiplicidad. Tenemos entonces la factorización 


/(A) = (A-2 1 )---(A-A n ). 


También podemos escribir /(A) en potencias decrecientes de A como sigue, 
m = A" + + .. • + Cl X + c 0 . 

Comparándolo con la forma factorizada encontramos que el término independien- 
te c 0 y el’ coeficiente de A”- 1 vienen dados por las fórmulas 


c 0 = (-i)”V --K 


— (h + ' ‘ ‘ + ^n) ■ 
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Puesto que también tenemos c 0 = ( — l)“detyl, vemos que 
=3 det A. 

Esto es, el producto de las raíces del polinomio característico de A es igual al 
determinante de A. 

La suma de las raíces de /(A) se llama traza de A, y se designa con tr A. Así 
pues, por defìnición 


tr a 


=jU- 


E1 coeficiente de A»~* viene dado por c„_ x = -tr A. También podemos calcular 
este coeficiente partiendo de /(A) en forma de determinante y encontramos 

c n-i = —iflu + • • • + a nn ). 

(En el ejercicio 12 de la sección 4.8 se pide una demostración de esa fórmula.) 
Las dos fórmulas de c„- x demuestran que 

trA = Ì>„. 

Esto es, la traza de A es también igual a la suma de los elementos diagonales de A. 

Puesto que la suma de los elementos diagonales es fácil de calcular, puede 
utilizarse como una comprobación numérica en los cálculos de autovalores. En los 
ejercicios que siguen veremos otras propiedades de la traza. 


4.8 Ejercicios 


Determinar los autovalores y los autovectores de cada una de las matrices de los ejer- 
cicios 1 al 3. Asimismo, para cada autovalor X calcular la dimensión del autoespacio £(X) 

•■[::]- •■[::]- *[::] 

fl a"| Tcose -senel 

2. \,a>0,b >0. 3. 

L* IJ L sene cos ej 

1 *> r° -'l ri 0-1 

> “2 — \ > -P3 = se presentan en la 

J L' oj [o -ij 


Las matrices P\ 
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teoría cuántica del Apin electrón y se denominan matrices spin de Pauli, en honor del 
físico Wolfgang Pauli (1900-1958). Comprobar que tienen los mismos autovalores 1 y — 1. 
Déterminar entonces todas las matrices 2X2 con elementos complejos que tengan los 
dos autovalores 1 y — 1. 

5. Determinar todas las matrices 2x2 con elementos reales cuyos autovalores sean a) reales 
y distintos, b) reales e iguales, c) complejos conjugados. 

6 . Determinar a, b, c, d, e, f sabiendo que los vectores (1, 1,1), 1, 0, — 1) y (1, —1, 0) son 
autovectores de la matriz 


'1 1 1' 
a b c 
d e f 

7. Calcular los autovalores y autovectores de cada una de las matrices siguientes. También, 
calcular la dimensión del autoespacio £(X) para cada autovalor X. 


'10 0' 


'2 1 3' 


' 5 -6 -6' 

-3 1 0 

, b) 

1 2 3 

, c) 

-14 2 

4-7 1 


3 3 20 


3 -6 —4_ 


8 . Calcular los autovalores de cada una de las cinco matrices 


ro o i o' 
0 0 0 1 
10 0 0 
„0 10 0 . 


0 

_0 


0 

0 

0 


b) 


0 

0 

0 


‘1 

0 

0 

0 

:i 


i 0 



•0 í 0 0' 

10 0 0 

c) 

0 0 0 1 
0 0 10 . 
0 0' 

0 0 

1 0 

0 - 1 _ 


Estas se llaman matrices de Dirac en honor de Pablo A. M. Dirac (1902- ), físico 
inglés. Se presentan en la resolución de la ecuación de ondas relativista en Mecánica 
Cuántica. 

9. Sí A y B son matrices «Xn, siendo B una matriz diagonal, demostrar (por inducción) 
que el determinante /(X) = det (Xfl — A ) es un polinomio en X con /(0) = ( — 1)" det A, 
y con el coefìciente de X* igual al producto de los elementos diagonales de B. 

10. Demostrar que una matriz cuadrada A y su transpuesta A' tienen el mismo polinomio 
característico. 

11. Si A y B son matrices nxn siendo A no singular, demostrar que AB y BA tienen el 
mismo conjunto de autovalores, incluso si A es singular, pero no es necesario demos- 
trar esto último. 
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12. Sea A una matriz nXn con polinomio característico f(\). Demostrar (por inducción) 
que el coeficiente de X* -1 en f(X) es — tr A. 

13. Sean A y B dos matrices nxn tales que det A = detfl y trA = trB. Demostrar que 
A y B tienen el mismo polinomio característico si n = 2 pero que esto no es seguro 
si n > 2. 

14. Demostrar cada una de las siguientes proposiciones relativas a la traza. 

a) tr (A + B) = tr A + trB. 

b) tr ( cA ) = ctr A. 

c) tr (AB) =tr (BA). 

d) tr A* = tr A. 


4.9 Matrices que representan la misma transformación lineal. Matrices lineales 

En esta sección demostramos que dos representaciones matriciales distintas 
de una transformación lineal tienen el mismo polinomio característico. Para ello 
estudiamos con mayor cuidado la relación entre las matrices que representan la 
misma transformación. 

Recordemos cómo se definen las representaciones matriciales. Supongamos 
que T: V W sea una aplicación de un espacio n-dimensional V en un espacio 
m-dimensional W. Sean (e t ..... e n ) y (w ^,..., w m ) bases ordenadas para V y 
W respectivamente. La representación matricial de T relativa a las bases elegidas 
es la matriz mXn cuyas columnas constan de los componentes de T(e a ),,.., T(e n ) 
respecto a la base (w x ,..., w m ). Partiendo de bases distintas se obtienen repre- 
sentaciones matriciales distintas. 

Consideremos ahora el caso en el que V = W, y supongamos que se utiliza la 
misma base (e x ,..., e„) para V y para W. Sea A = ( a u) la matriz de T relativa 
a esta base. Esto significa que 


(4.8) T(e k ) = 2 a ik e t para k = 1, 2.i». 

Elijamos ahora otra base (t+ ,..., u„) para V y W y sea B = (&*/) la matriz de T 
relativa a esta nueva base. Entonces tenemos 


(4.9) 


T( Uj ) = 2 b kj u k para j=í,2,...,n. 
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Ya que cada Uj pertenece al espacio engendrado por e lt ... ,e n podemos es- 
cribir 

( 41 °) = J,c kj e k para j = 1,2,. . . ,n, 

para un cierto conjunto de escalares Ctj. La matriz nXn C = ( Ckj ) determinada 
por esos escalares es no singular puesto que representa una transformación lineal 
que aplica una base de V en otra base de V. Aplicando T a los dos miembros de 

(4.10) también obtenemos las ecuaciones 


(4.11) T(Uj) = 1 :c ki T(e k ) para j =1,2 . n. 

Los sistemas de ecuaciones del (4.8) al (4.11) pueden escribirse con mayor 
simplicidad en forma matricial introduciendo matrices cuyos elementos sean vec- 
tores. Sean 


E = [e lf ..., e n ] y U = [u^ . u n ] 


matrices fila 1 X« cuyos elementos son los de la base que se considera. Entonces 
el conjunto de ecuaciones (4.10) puede escribirse mediante una ecuación matricial 
única, 


(4.12) 


Análogamente, si introducimos 


E' = [7X0, • • •, T(e n )] y U' = [r(«,),.... T(u n )], 


Las ecuaciones (4.8), (4.9) y (4.11) se convierten respectivamente en 

(4.13) E' = EA, U' = UB, U' = E'C. 

A partir de (4.12) también se obtiene 


E=UC~K 
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Para hallar la relación entre A y B expresamos U' de dos maneras en función 
de U. De (4.13) tenemos 


y 


U' = UB 

U' = E'C = EAC = UC~ X AC. 


Por lo tanto UB = UC^AC. Pero cada elemento en esta ecuación matricial es una 
combinación lineal de los vectores base th ,... ,u«. Puesto que los Ui son inde- 
pendientes debe ser 


B = C-^AC. 

Con ello, hemos demostrado el siguiente teorema. 

teorema 4.6. Si dos matrices nXtt A y B representan la misma transfor- 
mación lineal T, existe una matriz no singular C tal que 

B = C-'AC. 

Además, si A es la matriz de T relativa d una base E = [e t ,..., e„] y B la 
matriz de T relativa a la base U = [u,,..., «„], entonces como C podemos tomar 
la matriz no singular que relaciona las dos bases a través de la ecuación matricial 
U = EC. 

También es cierto el recíproco del teorema 4.6. 

teorema 4.7. Sean A y B dos matrices nXn relacionadas por una ecuación 
de la forma B = C -1 AC, en la que C es una matriz nXn no singular. Entonces 
A y B representan la misma transformación lineal. 

Demostración. Elijamos una base E = [e^,..., e„] para un espacio n-di- 
mensional V. Sean u t ,... ,Un los vectores determinados por las ecuaciones 


(4.14) u s = ^c ki e k para j =1,2 . n, 

*-i 

en donde los escalares c*,- son los elementos de C. Puesto que C es no singular re- 
presenta una transformación lineal invertible, así que U = u n ] es tam- 

bién una base para V, y tenemos U = EC. 

Sea T la transformación lineal que tiene A como representación matricial 
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respecto a la base E, y sea S la transformación lineal qué tiene B como represen- 
tación matricial relativa a la base U. Tenemos entonces 

(4.15) T(e t ) = para k = 1,2.n 

y 

(4.16) S(u ,) = 2 b tl u t para j = 1,2,. n. 

Demostraremos que S = T probando que T(h/) = S(«,) para cada /. 

Las ecuaciones (4.15) y (4.16) pueden escribirse en forma matricial como 
sigue. 


mo.n«„)i = ^, [s( Wl ),.... s(«j] = ub . 

Aplicando T a (4.14) se obtiene también la relación T(uj) = 2 c k jT(e k ), o 


tn«i).n«„)i = ^c. 

Pero tenemos 


UB = ECB = EC(C~ l AC) = EAC, 

que demuestra que T(uj) = S(u,) para cada /. Por consiguiente, T(x) = S(x) para 
cada x de V, con lo que T = S. Dicho de otro modo, las matrices A y B repre- 
sentan la misma transformación lineal. 

definición. Dos matrices nXn A y B se llaman semejantes si existe una 
matriz no singular C tal que B = C -1 AC. 

Los teoremas 4.6 y 4.7 pueden combinarse dándonos el siguiente 

teorema 4.8. Dos matrices nXn son semejantes si y sólo si representan la 
misma transformación lineal 

Las matrices semejantes tienen muchas propiedades. Por ejemplo, tienen el 
mismo determinar.te puesto que 

det (C-'AC) = det (C^Xdet ^)(det C) = det A. 

Esta propiedad nos da el teorema siguiente. 

teorema 4.9. Las matrices semejantes tienen el mismo polinomio caracte- 
rístico y por tanto los mismos autovalores. 
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Demostración. Si A y B son semejantes existe una matriz no singular C 
tal que B = C~ X AC. Por consiguiente, tenemos 

XI - B = XI - C~ X AC = XC-HC - C _1 AC = C~\XI - A)C. 

Esto prueba que XI—B y*-I—A son semejantes, así que det (A./— B) = det (A I—A). 

Los teoremas 4.8 y 4.9 prueban que todas las representaciones matriciales 
de una transformación lineal dada T tienen el mismo polinomio característico. 
Este polinomio también se Ilama el polinomio característico de T. 

E1 teorema que sigue es una combinación de los teoremas 4.5, 4.2 y 4.6. 
En el teorema 4.10, F representa bien el cuerpo real R o el cuerpo complejo C. 

teorema 4.10. Si T\V -> V es una transformación lineal, siendo F el 
cuerpo de escalares deVy dim V=n y suponemos que el polinomio característico 
de T tiene n raíces distinta ,K en F, entonces: 

a) Los autovectores correspondientes tq ,..., u„ forman una base para V. 

b) La matriz de T relativa a la base t/ = [u x ,..., u„] es la matriz diago- 
nal A que tiene los autovalores como elementos diagonales: 

A = diagA„). 

c) Si A es la matriz de T relativa a otra base E — ,..., e„], entonces 

A = C-L4C, 

donde C es la matriz no singular que relaciona las dos bases mediante 
la ecuación 


Demostración. Según el teorema 4.5 cada raíz A, es un autovalor. Puesto 
que existen n raíces distintas, el teorema 4.2 nos dice que los autovectores corres- 
pondientes u, ,..., u„ son independientes. Luego forman una base para V. Esto 
demuestra a). Como T(u.) = Kut, la matriz de T relativa a U es la matriz diagonal 
A, lo que demuestra b). Para demostrar c) utilizamos el teorema 4.6. 

Observación: La matriz no singular C del teorema 4.10 se llama matriz diagonali- 
zante. Si (e,,..., e„) es la base de los vectores coordenados unitarios (h,..., /„), en- 
tonces la ecuación U = EC del teorema 4.10 demuestra que la columna k de C consta 
de los componentes de los autovectores u k relativos a (I t ,..., /„). 

Si los autovalores de A son distintos, entonces A es semejante a una matriz 
diagonal. Si los autovalores no son distintos, A podría hacerse semejante a una 
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matriz diagonal. Esto sucederá si y sólo si existen k autovectores independientes 
correspondientes a cada autovalor de multiplicidad k. Vamos a ver ejemplos en 
los ejercicios que siguen. 

4.10 Ejercicios 


1. Demostrar que las matrices 



tienen los mismos autovalores pero no 


son semejantes. 

2. Hallar en cada caso una matriz no singular C tal que C 'AC es una matriz diagonal o 
justificar por qué tal matriz C no existe 


'1 0' 

ri 2 

1 r 2 11 

' 2 r 


(b) A = 

. (c) A = I 

(d) A = 

1 3j’ 

_5 4 

J L" 1 4 J 

_ —! 0 


3. Se dan en el plano tres bases. Con respecto a esas bases un punto tiene como compo- 
nentes (x,, x : ), (yi.yd, y (zi, z 2 ) respectivamente. Supongamos que [yi,y 2 ] = [xi,x 2 M, 
[zi,z 2 ] = [Xi,*]fl, y [zi,z 2 ] = [yi,y 2 ]C siendo A, B, C matrices 2x2. Expresar C en 
función de A y B. 

4. En cada caso, demostrar que los autovalores de A no son distintos pero que A tiene tres 
autovectores independientes. Hallar una matriz no singular C tal que C~ l AC sea una 
matriz diagonal. 


'0 0 1' 


' 1 -1 -1' 

0 1 0 

, b) A = 

1 3 1 

1 0 0 


-1 -1 1 


5. Demostrar que ninguna de las matrices siguientes es semejante a i 
pero que cada una es semejante a una matriz triangular de la forma 


Y2 -n r 2 n 

a) b) 

0 2 L-1 4 


6 . Determinar los autovalores y los autovectores de la matriz 
demostrar que no es semejante a una matriz diagonal. 




7. a) Demostrar que una matriz cuadrada A es no singular si y sólo si 0 no es autova- 
lor de A. 
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b) Si A es no singular, demostrar que los autovalores de A~‘ son los recíprocos de los 
autovalores de A. 

8 . Dada una matriz A nXn con elementos reales tal que A 1 = —I. Demostrar las propo- 
siciones siguientes referentes a A. 

a) A es no singular. 

b) n es par. 

c) A no tiene autovalores reales. 

d) det A = 1. 
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AUTOVALORES DE OPERADORES 
EN ESPACIOS EUCLÍDEOS 


5.1 Autovalores y productos interiores o escalares 

Este capítulo se ocupa de algunas propiedades de los autovalores y autovec- 
tores de las transformaciones lineales que operan en espacios euclídeos, esto es, 
en espacios lineales que tienen producto interior o escalar. Recordemos las propie- 
dades fundamentales de los productos interiores. 

En un espacio euclídeo real un producto interior (x,y) de dos elementos x e y 
es un número real que satisface las propiedades siguientes: 

(1) (x,y) = (y, x) (simetría) 

(2) (x + z,y) = (x,y) + (z,ý) (linealidad) 

(3) (cx, 7 ) = c(x, ý) (homogeneidad) 

(4) (jc, x) > 0 if xjt O (positividad). 

En un espacio euclídeo complejo el producto interior es un número complejo 
que satisface las mismas propiedades, con la excepción de que la simetría se reem- 
plaza por la simetría de Hermite o hermitiana, 

(l') (x, y) = (y,x), 

en donde la barra representa el complejo conjugado. En 3) el escalar c es complejo. 
De (l') y (3) obtenemos 

(3') (x, cy) = c(x,y), 

que nos dice que los escalares son conjugados cuando se sacan del segundo factor. 
Haciendo en (l') x = y vemos que (jc, x) es real, con lo que la propiedad (4) tiene 
sentido si el espacio es complejo. 

Cuando hablamos de espacio euclídeo, sin más, se sobreentiende que el 
espacio puede ser real o complejo. Si bien la fnayor parte de nuestras aplicaciones 
se harán en espacios de dimensión fìnita, no impondremos esa restricción a priori. 
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E1 primer teorema demuestra que los autovalores (si existen) pueden expre- 
sarse en función del producto interior. 


teorema 5.1. Si E es un espacio euclídeo, V un subespacio de E y consi- 
deramos una transformación lineal T-.V E que tenga un autovalor X con un 
correspondiente autovector x, entonces 


(5.1) 


, (T(x),x) 

(x,x) 


Demostración. Puesto que T(x) = Xx tenemos 


(T(x), x) = (lx, x) = l(x, x). 


Como xîAO podemos dividir por (x,x) obteniendo (5.1). 


Varias propiedades de los autovalores se deducen fácilmente a partir de la 
ecuación (5.1). Por ejemplo, de la simetría hermitiana del producto interior te- 
nemos la fórmula análoga 


(5.2) 


T (X, T(x)) 
(x, x) 


para el complejo conjugado de A.. De (5.1) y (5.2) deducimos que X es real 
(A = 1) si y sólo si (T(x), x) es imaginario puro, esto es, si y sólo si 


(T(x), x) = (x, T(x)) para el autovector x. 


(Esta condición se cumple en un espacio euclídeo real). También, A es imaginario 
puro (A= —I) si y solamente si (T(x), x) es imaginario puro, lo que es lo mismo, 
si y solamente si 


(T(x), x) = —(x, T(x)) para el autovector x. 

5.2 Transformaciones hermitianas y hemi-hermitianas 

En esta sección introducimos dos tipos importantes de operadores lineales 
que actúan en espacios euclídeos. Esos operadores tienen dos categorías de deno- 
minaciones, que dependen de si el espacio euclídeo fundamental tiene producto 
interior real o complejo. En el caso real las transformaciones se llaman simétricas 
o hemi-simétricas. En el caso complejo se llaman hermitianas o hemi-hermitianas. 
Esas transformaciones se presentan en multitud de aplicaciones distintas. Por 
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ejemplo, los operadores hermitianos en espacios de dimensión infinita desempe- 
nan un importante papel en Mecánica Cuántica. Discutiremos en primer lugarel 
caso complejo ya que no presenta nuevas dificultades. 

definición. Sean E un espacio euclídeo y V un subespacio de E. Una 
transformación lineal T\V~*Ese llama hermitiana en V si 

( T ( x )>y) = (*> T (y)) para todo x y todo y de V. 

El operador T se llama hemi-hermitiano en V si 

(T(x),y) = — (*, T(y)) para todo x y todo y de V. 

Dicho de otro modo, un operador hermitiano T puede pasarse de un factor 
de un producto interior al otro sin modificar el valor del producto. Tal paso en 
el caso de un operador hemi-hermitiano cambia el signo del producto. 

Observación: Como ya se ha mencionado, si E es un espacio euclídeo real, las trans- 
formaciones hermitianas también se llaman simétricas; las transformaciones hemi-hermi- 
tianas se llaman hemi-simétricas. 

ejemplo 1. Simetría y hemi-simetría en el espacio C(a,b). Sea C(a,b) 
el espacio de todas las funciones reales continuas en un intervalo cerrado [a, fe], 
con el producto interior real 


(/>g) = S b J(t)g(t) dt. 

Sea V un subespacio de C(a, b). Si T: V ~* C(a, b) es una transformación lineal, 
entonces (f,T(g)) f(t)Tg(t)dt, donde hemos escrito Tg(t) en lugar de T(g)(t) 
Por consiguiente, las condiciones para la simetría y la hemi-simetría se convier- 
ten en 

( 5 - 3 ) /„ {f(t)Tg(t) — g(t)Tf(t)} dt = 0 si T es simétrica, 

y 

( 5 - 4 ) /„ {/(0Tg(í) + g(t)Tf(t)} dt — 0 si T es hemi-simétrica. 


ejemplo 2. Multiplicación por una función fija. En el espacio C(a, b) del 
ejemplo 1, elijamos una función fija p y definamos T(f) = pf, producto de p y /. 
Para esa T, la ecuación (5.3) se satisface cualesquiera que sean / y g en C(a, b) 
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nuesto que el integrando es cero. Por consiguiente, la multiplicación por una fun- 
ción fìja es un operador simétrico. 

ejemplo 3. El operador derivada. En el espacio C(a,b) del ejemplo 1, 
sea V el subespacio de todas las funciones / que tienen derivada-continua en el 
intervalo abierto ( a, b) y que satisfacen también la condición de contorno 
f(a ) = f(b). Sea D\ V C(a, b ) el operador derivada dado por D(f) — f. Resulta 
sencillo demostrar que D es hemi-simétrico. En este caso el integrando de (5.4) es 
la derivada del producto fg, por lo cual la integral es igual a 


J o " (/g)'(0 dt = f(b)g(b) - f(a)g(a). 


Puesto que / y g satisfacen ambas la condición de contorno, tenemos 
f(b)g(b) — f(a)g(a) = 0. Así pues, la condición de contorno implica la hemi-sime- 
tría de D. Las funciones constantes son las únicas autofunciones en el subespa- 
cio V. Pertenecen al. autovalor 0. 

ejemplo 4. Operadores de Sturm-Liouville. Este ejemplo es importante 
en la teoría de las ecuaciones diferenciales lineales de segundo orden. Utilicemos 
una vez más el espacio C(a, b) del ejemplo 1 y sea V el subespacio de todas las 
funciones / que tienen derivada segunda continua en [a,b] y que satisfacen las 
condiciones de contomo 

(5.5) p(a)f(a) = 0, p(b)f(b) = 0, 

siendo p una función fija de C(a, b) con derivada continua en [a, b]. Sea q otra 
función fija en C(a, b) y sea T: V -> C(a, b) el operador definido por la ecuación 

T(f) = (pf'Y + qf. 

Éste se llama operador de Sturm-Liouville. Para averiguar su simetría observemos 
que fT(g) — gT(f) — f(pg’)' — g(pf')'. Utilizando este resultado en (5.3) e inte- 
grando por partes, encontramos 


JJ ífT(g) - gT(f)} dt =fpg' |*- J o 6 pg’f dt - gpf | 6 + J o pfg’ dt = 0, 

ya que tanto / como g satisfacen Ias condiciones de contorno (5.5). Por tanto 
T es simétrico en V. Las autofunciones de T son aquellas funciones no nulas 
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/ que satisfacen, para un cierto valor real A, una ecuación diferencial de la forma 

( Pf'ï + qf=¥ 


en [a, 6], y las condiciones de contorno (5.5). 

5.3 Autovalores y autovectores de los operadores hermitianos y hemi-hermitianos 

En cuanto a los autovalores tenemos el siguiente teorema: 

teorema 5.2. Si T tiene un autovalor A, entonces: 

a) Si T es hermitiano, A es real: X = 1. 

b) Si T es hemi-hermitiano, A es imaginario puro: A = — I. 

Demostración. Sea x un autovector correspondiente a A. Tenemos entonces 

- ^ (T(x),x) , _ (x, T(x)) 

(x, x) (x, x) 

Si T es hermitiano tenemos (T(x), x) = (x, T(x)) así que A = 1. Si T es hemi- 
hermitiano tenemos (T(x),x) = — (x,T(x)) con lo cual X = — X. 

Observación: Si T es simétrico, el teorema 5.2 nada nuevo nos dice acerca de los 
autovalores de T puesto que todos los autovalores deben ser reales si su producto interior 
es real. Si T es hemi-simétrico, los autovalores de T deben ser a un tiempo reales e 
imaginarios puros, iuego deben ser cero (si existen). 


5.4 Ortogonalidad de Ios autovectores correspondientes a autovalores distintos 

Los autovalores distintos de una transformación lineal cualquiera correspon- 
den a autovectores independientes (según el teorema 4.2). Para las transforma- 
ciones hermitianas y hemi-hermitianas podemos decir aún más. 

teorema 5.3. Si T es una transformación hermitiana o hemi-hermitiana 
y si Aji/ì son autovalores distintos de T con los autovectores correspondientes 
x e y, entonces x e y son ortogonales; esto es (x, y) = 0. 

Demostración. Escribamos T(x) = kx, T(y) — /j-y y comparemos los dos 
productos interiores (T(x), y) y (x, T(y)). Tenemos 


(T(x),ý) = (Xx,y) = X(x,ý) y (x, T(y)) = (x, pý) = fi(x,ý ). 
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Si T es hermitiana esto nos da A.(x, y) = p,(x, y) = n(x, y ) ya que p = p. Por con- 
siguiente (x, y) = 0 puesto que [i. Si T es hemi-hermitiana obtenemos 
A(x, y) = —p(x,y) = p.(x, y) que implica también (x, y) = 0 . 

ejemplo. Apliquemos el teorema 5.3 a aquellas funciones no nulas que 
satisfacen una ecuación diferencial de la forma 

( 5 . 6 ) (Pf'r + qf=¥ 

en un intervalo [a, b], y que satisfacen también las condiciones de contorno 
p(á)f(á) = p(b)f(b) = 0. La conclusión es que dos soluciones cualesquiera f y g 
correspondientes a dos valores distintos de A. son ortogonales. Por ejemplo, con- 
sideremos la ecuación diferencial del movimiento armónico simple 

f + kj= 0 

en el intervalo [0, tt], siendo k¥= 0 . Ésta tiene la forma (5.6) con p = 1, q = 0, 
y \ = —h*. Todas las soluciones vienen dadas por f(t) = c x cos kt + c 2 sen kt. 
La condición de contorno /(0) = 0 implica = 0. La segunda condición de 
contorno, f(ir) = 0, implica c 2 sen kir = 0. Puesto que c 2 ¥ 0 para una solución 
no nula, debe ser sen kir = 0, lo que indica que k es entero. Dicho de otro 
modo, las soluciones no nulas que satisfacen las condiciones de contorno existen si 
y sólo si k es entero. Esas soluciones son f(t) = sen nt,n = ±1, ±2, .... La con- 
dición de ortogonalidad que el teorema 5.3 implica, se transforma ahora en la 
relación conocida 


J o sen nt sen mt dt = 0 
si m 2 y n 2 son enteros distintos. 

5.5 Ejercicios 

1. Sean E un espacio euclídeo y V un subespacio, y sea T: V -> E una transformación 
lineal dada. Sean X un escalar y x un elemento no nulo de V. Demostrar que X es un 
autovalor de T, con x como autovector, si y sólo si 

(T(x),y) = X(x, y) para todo y de E. 

2. Sea T(x) = cx para todo x un espacio lineal V, siendo c un escalar fìjado. Demostrar 
que T es simétrico si V es un espacio euclídeo real. 

3. Supongamos que T: V -> V es una transformación hermitiana. 

a) Demostrar que T" es hermitiana para todo entero positivo n, y que T es hermitiana 
si T es invertible. 

b) tQué puede decirSe de T' y de T ' si T es hemi-hermitiana? 
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4. Sean T,: V —> E y T 2 : V —» £ dos transformaciones hermitianas. 

a) Demostrar que qTi + bT 2 es hermitiana para todo par de escalares reales a y b . 

b) Demostrar que el producto (la composición) TiT 2 es hermitiana si Ti y Ti son permu- 
tables, esto es, si T,T 2 = T 2 Tj. 

5. Sea V = V)(R) con el producto escalar ordinario como producto interior. Sea T una 
simetría en el plano xy; esto es, T(») =», T(j ) =j y T(k) = —k. Demostrar que T 
es simétrica. 

6. Sea C(0, 1) el espacio lineal real de todas las funciones continuas en [0,1] con producto 
interior (/, g) =JJ j(t)g{i)dt. Sea V el subespacio de todas las / tales que JJ f(t)dt = 0. Sea 
T: V —» C(0,1) el operador integración definido por Tf(x) = JJ f(t)dt. Demostrar que T 
es hemi-simétrica. 

7. Sea V el espacio euclídeo real de todos los polinomios con el producto interior 
(/, g) =Jl_if(t)g(t)dt. Determinar cuáles de las siguientes transformacioncs T:V->V son 
simétricas o hemi-simétricas: 

a) Tf(x) =f(-x). c) Tf(x) =f(x) +f(-x). 

b) Tf(x) =f(x)f(-x). d) Tf(x) =f(x) -f(-x). 

8. En el ejemplo 4 de la sección 5.2, modificar el producto interior así: 

(f,g)= \[f(t)g(t)w(t)dt, 

siendo w una función positiva fijada perteneciente a C(a, b). Modificar el operador T de 
Sturm-Liouville escribiendo 


T(f) = +q f . 

>v 

Demostrar que el operador modificado es simétrico en el subespacîo V. 

9. Sea V un subespacio de un espacio euclídeo complejo E. Sea T:V~*E una transfor- 
mación lineal y definamos una función de valores escalares Q en V, como sigue: 

Q(x) = (T(x), x) para todo jc de V. 

a) Si T es hermitiana en V, demostrar que Q(x) es real para todo x. 

b) Si T es hemi-hermitiana, demostrar que Q(x) es imaginaria pura para todo x. 

c) Demostrar que Q(tx) =tîQ(x) para todo escalar t. 

d) Demostrar que Q(x + y) =Q(x) + Q(y) + (T(x),y) + (T(y), x), y hallar la fórmula 
análoga para Q(x + ty). 

e) Si Q(x) = 0 para todo x demostrar que T(x) = O para todo x. 

f) Si Q(x) es real para todo x demostrar que T es hermitiana. [ Indicación: Utilizar 
la propiedad de que Q(x + ty) es igual a su conjugada para todo escalar í.] 

10. Este ejercicio pone de manifiesto que los polinomios de Legendre (introducidos en la 
sección 1.14) son autofunciones de un operador de Sturm-Liouville. Los polinomios de 
Legendre se definen mediante la ecuación 

P n(0=~f^(t), t donde /„(/) = (/ 2 - 1)". 

a) Comprobar que (t 1 — !)/'„(/) = 2 ntf„(t) . 



148 Autovalores de operadores en espacios euclídeos 

b) Derivar la ecuación del apartado a) n + 1 veces, mediante la fórmula de Leibniz 
(ver p. del Volumen I) con lo que se obtiene 

( , 2 _ iy(n+2)(,) + 2 t(n + 1 + n(n + l)/ ( n n) (t) 


= 2ntf (n +^(t) + 2 n(n + l)/^>(í). 

c) Demostrar que la ecuación del apartado b) puede ponerse en la forma 
[(/* - 1 )P’ n (t)Y = n(n + 1 )P n (t). 

Esto demuestra que P n (t) es una autofunción del operador de Sturm-Liouville dado en 
el intervalo [ — 1,1] por medio de T(f ) = (pf'Y, siendo p(t) = f — 1 . La autofunción 
P„(t) pertenece al autovalor X = n(n + 1). En este ejemplo las condiciones de contomo 
para Ia simetría se satisfacen automáticamente puesto que p(l) = p(— 1) = 0. 


5.6 Existencia de un conjunto ortonormal de autovectores para operadores hermi- 

tianos y hemi-hermitianos que actúan en espacios de dimensión finita 

Los dos teoremas 5.2 y 5.3 se fundamentan en la hipótesis de que T tiefte 
un autovalor. Como sabemos, los autovalores no existen necesariamente. No obs- 
tante si T actúa en un espacio complejo de dimensión finita, entonces existen 
siempre los autovalores puesto que son las raíces del polinomio característico. 
Si T es hermitiano, todos los autovalores son reales. Si T es hemi-hermitiano, 
todos los autovalores son imaginarios puros. 

También sabemos que dos autovalores distintos pertenecen a autovectores 
ortogonales, si T es hermitiano o hemi-hermitiano. Usando esta propiedad se 
puede probar que T tiene un conjunto ortonormal de autovectores que engendran 
todo el espacio. (Recordemos que un conjunto ortogonal se llama ortonormal si 
cada uno de sus elementos tiene norma 1.) ' 

teorema 5.4. Supongamos que dim V = n y sea T: V -> V hermitiano o 
hemi-hermitiano. Existen entonces n autovectores u, ,,u„ de T que forman 
una base ortonormal para V. Por tanto.la matriz de T relativa a esta base es la 
matriz diagonal A = diag (^ ,..., )+,), en donde A* es el autovalor perteneciente 
a u k . 

Demostración. Utilicemos el método de inducción respecto a la dimensión 
n . Si n = 1, entonces T tiene exactamente un autovalor. Cualquier autovector 
«i de norma 1 es una base ortonormal para V. 

Supongamos ahora el teorema cierto para todo espacio euclídeo de dimen- 
sión n — 1. Para demostrar que es cierto para V elijamos un autovalor K para 
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T y un autovector correspondiente u x de norma 1. Entonces T(uj) = Al«i y 
llujjl = 1 . Sea S el subespacio engendrado por «i . Aplicaremos la hipótesis de 
inducción al subespacio S-L que consta de todos los elementos de V que son orto- 
gonales a «i, 


S L = {x\xeV,(x, «i) = 0}. 


Para ello necesitamos saber que dim S- 1 - = n— 1 y que T aplica S- 1 - en sí mismo. 

Según el teorema 1.7 a) sabemos que u t es parte de una base para V, sea 
ésta la base («j, v 2 ,..., v„). Podemos suponer, sin pérdida de generalidad, que 
ésa es una base ortonormal. (Si no lo fuera, aplicaríamos el método de Gram- 
Schmidt para convertirla en tal, manteniendo u t como primer elemento de la 
bas<*) Tomemos seguidamente un x cualquiera en S- 1 - y escribamos 

X = Xitq + X 2 V 2 +-h X n V n . 

Entonces = (x, u x ) = 0 ya que la base es ortonormal, así que x pertenece al 
espacio engendrado por v 2 ,... ,v n ■ Luego dimS- 1 - = n— 1 . 

Demostremos a continuación que T aplica S x en sí mismo. Supongamos que 
T es hermitiana. Si x e S 1 tenemos 

(T(x), Ul ) = (x, T( Ul )) = (x, X lUl ) = ^(x, Ul ) = 0, 

por lo que T(x) 'e S 1 -. Puesto que T es hermitiana en S- 1 - podemos aplicar la hi- 
pótesis de inducción encontrando que T tiene n — 1 au.tovectores u 2 ,... ,u„ que 
constituyen una base ortonormal para S- 1 -. Por lo tanto, el conjunto ortogonal 
«i,...,u„ es una base ortonormal para V. Esto demuestra el teorema si T es 
hermitiana. Argumento similar aplicaremos si T es hemi-hermitiana. 

5.7 Representación matricial para operadores hermitianos y hemi-hermitianos 

Suponemos en esta sección que V fcs un espacio euclídeo de dimensión fini- 
ta. Una transformación hermitiana o hemi-hermitiana puede caracterizarse por 
su acción sobre los elementos de una base cualquiera. 

teorema 5.5. Sean (e ± ,... ,e„) una base para V y T: V -» V una trans- 
formación lineal. Tenemos entonces: 

a) T es hermitiana si y sólo si (Tfa), eì) = (e,-, T(ei)) para todo par i, j. 

b) T es hemi-hermitiana si y sólo si(T(ej),ei)= — (e„ T(ei))para todo par i, j. 

Demostración. Tomemos dos elementos cualesquiera x e y de V y expre 
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semos cada uno en función de los elementos de la base, sean x = 2 x .i e i e 
y = 2 y‘ e ‘ • Tenemos entonces 

(T(x),y)= (J>,T(e,),y) = jU(r(e,) f< |*^ = 2 2 ^(Tíe,), ej. 

Del mismo modo encontramos 

ix,T(yy)=HxMe i ,T(.eù). 

i=li~l 


Las proposiciones a) y b) se deducen al momento a partir de esas ecuaciones. 

Vamos a expresar estos conceptos por medio de la representación matricial 
de T. 

teorema 5.6. Sea (e x ,... ,e„) una base ortonormal para V, y sea A = (a tj ) 
la representación matricial de una transformación lineal T: V -» V respecto de esa 
base. Tenemos entonces: 

a) T es hermitiana si y sólo si a tj = para todo par i, /'. 

b) T es hemi-hermitiana si y sólo si a (j = —â j( para todo par i, j. 
Demostración. Puesto que A es la matriz de T tenemos T(e ; ) = 2Li a ki e k ■ 

Tomando el producto interior de T(e,) por e ( y teniendo en cuenta la linealidad 
del producto interior obtenemos 


(T(e # ), e ( ) = ( 2 a ki e k > e,ì = 2 a kÂ e k > e ù • 

\i-l / *-i 

Pero (ei, e,) = 0 salvo si k = i, así que la última suma se reduce a 
e.) = Oij ya que (e„ ei) = 1 . Luego resulta 

a (j = (T(e,), e<) para todo par i, /'. 

Intercambiando i y /', tomando los conjugados, y teniendo en cuenta la simetría 
hermitiana del producto interior, encontramos 

à j( = (e,, T(e<)) para todo par i, /'. 

Para completar- la demostración basta aplicar ahora el teorema 5.5. 

5.8 Matrices hermitianas y hemi-hermitianas. Matriz adjunta de una matriz 

E1 teorema 5,6 nos sugiere la siguiente definición. 
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definición. Una matriz cuadrada A = (a,y) se denomina hermitiana ■ si 
a u = àjipara todo par i, j. Se dice que A es hemi-hermitiana si a tj = —à fi para 
todo par i,j. 

E1 teorema 5.6 establece que una transformación T en un espacio V de di- 
mensión finita es hermitiana o hemi-hermitiana según que su matriz relativa a 
una base ortonormal sea hermitiana o hemi-hermitiana. 

Esas matrices pueden introducirse de otra manera. Llamemos Â la matriz 
obtenida reemplazando cada elemento de A por su complejo conjugado. La ma- 
triz Â se llama la conjugada de A. La matriz A es hermitiana si y sólo si es 
igual a la transpuesta de su conjugada A = À*. Es hemi-hermitiana si A = —Â*. 
La transpuesta de la conjugada recibe un nombre especial. 

DEFINICIÓN DE MATRIZ ADJUNTA DE UNA MATRIZ DADA. Dada Um matrÌZ 

cualquiera A, la transpuesla de la conjugada, Â*, se llama también adjunta de A 
y se representa por A*. 

Así pues, una matriz cuadrada A es hermitiana si A = A*, y hemi-hermi- 
tiana si A = — A*. Una matriz hermitiana se llama también auto-adjunta. 

Observación: Gran parte de la antigua literatura relativa a matrices utiliza la denomi- 
nación de adjunta para la transpuesta de la mátriz cofactor, que es un ente completa- 
mente distinto. La definición dada aquí está de acuerdo con la nomenclatura actual de 
la teoría de operadores lineales. 


5.9 Diagonalización de una matriz hermitiana o hemi-hermitiana 

teorema 5.7. Toda matriz A, «X«, hermitiana o hemi-hermitiana es se- 
mejante a la matriz diagonal A = diag (\ x ,... ,K) de sus autovalores. Además, 
tenemos 


A = C-'AC, 

en donde C es una matriz no singular cuya inversa es su adjunta, C -1 = C*. 

Demostración. Sea V el espacio de las n-plas de números complejos, y 
sea (e^,..., e n ) la base ortonormal de vectores coordenados unitarios. Si 
v = ^ e y = ^yiei, consideremos el producto interior dado por (x,y) = 
= 2 x iŷi • P ara la matriz dada A, sea T la transformación representada por A 
relativa a la base elegida. Entonces el teorema 5.4 nos dice que V tiene una base 
ortonormal de autovectores («!,..., uA, respecto a la cual T tiene una repre- 
sentación en matriz diagonal A = diag (A^,..., A„), siendo el autovalor per- 
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teneciente a uh . Puesto que tanto A como A representan T, serán semejantes, así 
que tenemos A = C - MC, donde C = (c,-,-) es la matriz no singular que relaciona 
las dos bases: 


[«!,...,«„]= [e ls ... ,e„JC. 

Esta ecuación muestra que la columna / de C consta de los componentes de 
Uj respecto a (e t ,..., e„). Por consiguiente, dj es el componente i-ésimo de uj. 
E1 producto interior de u, y u, viene dado por 

(«>,«<) 

Puesto que {«!,... ,u M } es un conjunto ortonormal, eso demuestra que CC* = I, 
con lo que C -1 = C* . 

Observación: La demostración del teorema 5.7 nos dice también la manera de deter- 
minar la matriz diagonalizante C. Encontramos un conjunto ortonormal de autovectores 
ui,...,u„ y luego utilizamos los componenles de «/ (relativos a la base de vectores 
coordenados unitarios) como elementos de la columna / de C. 


ejemplo 1. La matriz real hermitiana A 


r 2 2~\ 

ti( 

2 5_ 


tiene los autovalores 


^i=l y A 2 = 6 . Los autovectores pertenecientes a 1 son t(2, —1), t¥= 0. Los 
pertenecientes a 6 sonj(l,2), t¥= 0. Los dos autovectores u x = í( 2 , — 1 ) y 
u — t(l, 2) con í = i /^/5 constituyen un conjunto ortonormal. Por consiguiente, 
la matriz 


M-i 2] 


V5| 

es una matriz diagonalizante para A. En este caso Ct C f puesto que C es real. 
Fácilmente se comprueba que C‘AC = 


'1 0 " 

0 6 ' 


ejemplo 2. Si >1 es ya una matriz diagonal, la matriz diagonalizante C del 
teorema 5.7 o bien deja invariable A 0 tan sólo reordena los elementos diagonales. 

5.10 Matrices unitarias. Matrices ortogonales 

definición. Una matriz cuadrada A se llama unitaria si AA* = I. Se 
llama ortogonal si AA* = I. 
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Observaciórt: Toda matriz unitaria real es ortogonal puesto que A* = A‘. 

E1 teorema 5.7 nos dice que una matriz hermitiana o hemi-hermitiana siem- 
pre puede ser diagonalizada por medio de una matriz unitaria. Una matriz real 
hermitiana tiene autovalores reales y los autovectores correspondientes pueden 
tomarse reales. Por consiguiente.una matriz real hermitiana puede ser diagona- 
lizada por una matriz real ortogonal. Esto no es cierto para las matrices hemi- 
hermitianas reales. (Ver el ejercicio 11 de la sección 5.11.) 

Asimismo tenemos los conceptos relacionados siguientes, 

definición. Una matriz cuadrada A con elementos reales o complejos se 
llama simétrica si A = A‘; se llama hemi-simétrica si A = —A*. 


ejemplo 3. Si A es real, su adjunta es igual a su transpuesta, A* = A*. 
Así pues, toda matriz hermitiana real es simétrica, pero una matriz simétrica no 
es necesariamente hermitiana. 


n + * 2 i 


ri-i 2i 

[ 3 -/ 4/J * 

entonces À = 

+ 

1 

4+ 


[1+i 3 - n fl - i 3 + fl 

^ L 2 4/ J y = [ 2 —4/ J ' 

ri 21 r i 2 + n 

ejemplo 5. Las dos matrices y son hermitianas. 

L2 3j - / 3 J 

La primera es simétrica, la segunda no. 

fO -2] [i -21 

ejemplo 6. Las dos matrices y son hemi-hermitianas. 

L2 oj y L 2 3/J 


La primera es hemi-simétrica, la segunda no. 

ejemplo 7. Todos los elementos diagonales de una matriz hermitiana son 
reales. Todos los elementos diagonales de una matriz hemi-hermitiana son ima- 
ginarios puros. Todos los elementos diagonales de una matriz hemi-simétrica son 
cero. 


ejemplo 8. Para una matriz cualquiera A, la matriz B = ỳ(A + A*) es 
hermitiana, y la matriz C = \(A — +*) es hemi-hermitiana. Su suma es A. Así 
pues, toda matriz cuadrada A puede expresarse como una suma A = B + C, sien- 
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do B hermitiana y C hemi-hermitiana. Es un ejercicio sencillo comprobar que 
esa descomposición es única. Asimismo toda matriz cuadrada A puede expre- 
sarse de manera única como suma de una matriz simétrica, l(A + A 1 ) , y una 
matriz hemi-simétrica, \(A — A‘). 

ejemplo 9. Si A es ortogonal tenemos 1 = det(AA*) = (det A)(det A‘) = 
= (detA) 2 , así que det A = ± 1. 

5.11 Ejercicios 

1. Determinar cuáles de las siguientes matrices son simétricas, hemi-simétricas, hermitianas 
o hemi-hermitianas. 



2. a) Comprobar que la matriz 2x2 A = 


'cos 0 
sen 0 



matriz ortogonal. 


b) Sea T la transformación lineal con la malriz anterior A relativa a la base ordinaria 
{/,/}. Demostrar que T aplica cada punto del plano de coordenadas polares (r, a) en el 
punto (r, a + e) . Así pues, T es una rotación del plano alrededor del origen, siendo 
9 el ángulo de giro. 

3. Sea V el espacio real de dimensión 3 con la base i,j, k. Demostrar que cada una 
de las matrices siguientes es ortogonal y representa la transformación que se indica. 



(simetrla en el plano x, y). 


(simetría respecto al eje x). 
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c) 


d) 


e) 


[-1 0 o ' 

0-1 0 

0 o-l 

‘l 0 0 

0 cos 0 —sen 6 

0 sen 6 cos 6 
‘-10 0 
0 cos 6 — sen 0 

0 sen 0 cos 0 


(simetría respecto al ûrigen). 


(rotación alrededor del eje x). 


(rotación alrededor del eje x seguida de 
simetría respecto al plano yz). 


4. Una matriz ortogonal real A se llama propia si det A = 1, e impropia si deí A = 

fcos0 -sen0"| 


a) Si A es una matriz propia 2x2, demostrar que A 


’cos 0 — sen0" 

sen0 cos 0 _ P 


0. Ésta representa una rotación de ángulo 9. 

01 


b) Demostrar que 


"1 0 1 f-1 0" 

.0 -ij y [ 0 1. 


son matrices impropias. La primera 


una simetría en el plano xy respecto al eje x; la segunda representa una simetría respecto 
al eje y. Hallar todas las matrices impropias 2x2. 

En cada uno de los ejercicios del 5 al 8, hallar a) un conjunto ortogonal de autovectores 
para A, y b) una matriz unitaria C tal que C 'AC sea una matriz diagonal. 


5. A = 


7. A = 


‘ 9 121 
12 16J 
"1 3 0" 

3 -2 -1 

0 -1 1 



'l 3 4‘ 


8. A = 3 1 0 

14 0 1 


9. Determinar cuáles 
(a,b,e reales). 


de las siguientes matrices son unitarias, y 


cuáles son ortogonales 




cos 0 0 sen 0 


‘|V 2 


Ì^6 

[o J- 

b) 

0 1 0 

. c) 

0 

^3 




—sen0 0 cos 0 




-|Vg_ 
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10. La teoría especial de la relatividad hace uso de las ecuaciones 


x'=a(x-vi), y’ = y, z'= z, t' = a(t - vx/c*). 


Aquí v es la velocidad de un objeto tnóvil, c la velocidad de la luz, y a = c/ V — v 2 . 
La transformación lineal que aplica (x, y, z, t) en (x’, y', z', t') se llama transformación 
de Lorentz. a) Pongamos (x t , x 2 , x a , jc 4 ) = (x,y, z, ict)y(x[ ,x' 2 ,x a , x^) =(x', y , z', ict'), 
Demostrar que las cuatro ecuaciones pueden ponerse en forma de una ecuación matri- 
cial como sigue. 


[Xi, x’ 2 ,x' 3 , x 4 ] 


0 0 
1 0 
0 1 
0 0 


—iavfc 

0 

0 


b) Demostrar que la matriz 4x4 de a) es ortogonai pero no unita 

11. Sean a un número real no nulo y A la matriz hemi-simétrica A = 

a) Hallar un conjunto orlonormal de autovectores para A. 

b) Hallar una matriz unitaria C tal que C~'AC sea una matriz diagonal. 

c) Demostrar que no existe una matriz ortogonal real C tal que C~'AC sea una matriz 
diagonal. 

12. Si los autovalores de una matriz hermitiana o hemi-hermitiana A son todos iguales a c, 
demostrar que A = c/. 

13. Si A es una matriz hemi-simétrica real, demostrar que las dos matrices I — A e / + A 
son no singulares y que (/ — A)(l + A)~' es ortogonal. 

14. Para cada una de las siguientes proposiciones relativas a Ias matrices nxn, dar una 
demostración o un contraejemplo. 

a) Si A y B son unitarias, entonces A + B es unitaria. 

b) Si A y B son unitarias, AB es unitaria. 

c) Si A y AB son unitarias, B es unitaria. 

d) Si A y B son unitarias, A + B no es unitaria. 



5.12 Formas cuadráticas 

Sean V un espacio euclídeo real y T: V V un operador simétrico. Esto 
significa que T puede cambiarse de un factor al otro en un producto interior 

(T(x),y) = (x, T(ý)) 

para todo par x,y de V. 

Dada T, definamos una función de vqlores reales Q en V mediante la ecuación 
Q(x) = (T(x),x). 
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La función Q se denomina forma cuadrática asociada a T. La palabra «cuadrá- 
tica» está sugerida por el teorema siguiente que muestra que en el caso de 
dimensión finita Q(x) es un polinomio cuadrático en los componentes de x. 

teorema 5.8. Sea (e x ,..., e„) una base ortonormal para un espacio euclí- 
deo V. Sean T:V -> V una transformación simétrica y A = (a i; ) la matriz de T 
relativa a esa base. Entonces la forma cuadrática Q(x) = (T(x), x) está ligada 
a A del modo siguiente: 

(5.7) Q(x) = 2 2 a <i x < x i si x = 2 x i e i- 

Demostración. En virtud de la linealidad tenemos T(x) = 2 x ( T(e,) . Por 
consiguiente, 

Q(x) - {fx ( T(e ( ), Ìx,eỳ = Ì J,x i x j (T(e i ), e t ). 

Esto demuestra (5.7) ya que ay = ân =(T(eì),eì). 

La suma que aparece en (5.7) tiene sentido incluso si la matriz A no es si- 
métrica. 

definición. Sea V un espacio euclídeo real cuálquiera con una base orto- 
normal (e x ,... ,e„), y sea A = (a, ; ) cuálquier matriz nXn de escalares. La fun- 
ción de valores escalares Q definida en cada elemento x = 2 x ( e ( de V por la 
suma doble 

(5.8) Q(x) = Ì ZftjXiXi 

se denomina la forma cuadrática asociada a A. 

Si A es una matriz diagonal, entonces a i( - = 0 si i ¥= j de modo que la suma 
(5.8) contiene únicamente cuadrados y se puede poner en la forma más sencilla 

(5-9) Q(x) = Ìa i( x*. 


En este caso la forma cuadrática se llama forma diagonal. 

La suma doble que aparece en (5.8) también se puede expresar como un 
producto de tres matrices. 
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teorema 5.9. Sea X = Ixi, ,Xnì una matríz fila 1 Xn, y sea A = (a^) 
una matriz nXn. Entonces XAX* es una matriz 1X1 cuyo elemento es 

ÌÌ>«*,**• 

Demostración. E1 producto XA es una matriz 1X», XA = [yi 
en donde el elemento y, es el producto escalar de X por la columna / de A, 

y, = t x * a u- 

Por consiguiente,el producto XAX‘ es una matriz lXl cuyo único elemento es 
el producto escalar 

Î/íXj =Ì = Ì Ì««*i*ì- 

Observación: Es .corriente identifìcar la matriz, lxl, XAX' con la suma (5.9) y 
llamar al producto XAX' forma cuadrática. La ecuación (5.8) se escribe más sencilla- 
mente así: 


Q(x)=XAX*. 


ejemplo 1. Sean A = J, X = [*i,*,]. Tenemos entonces 

XA = [*i, x 2 ]|^ ^ 5j = [*! — 3x 2 , —Xì + 5x 2 ], 


y por tanto 


XAX 1 = [xi - 3x 2 , -Xi + 5x 2 ] 


— 3x 2 Xi — x x x 2 + 5x 2 . 


EJEMPLO 2. 




. Tenemos entonces 


-2 
-2 5. 


= Xi — 2 x 2 Xj — 2x x x 2 + 5x 2 . 


En ambos ejemplos 1 y 2, los términos en los productos mixtos dan al su- 
marlos' — 4x,x 2 así que XAX‘ = XBX*. Estos ejemplos ponen de manifìesto que 
matrices distintas pueden conducir a la misma forma cuadrática. Obsérvese que 
una de esas matrices es simétrica. Esto constituye un ejemplo del siguiente 
teorema. 
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teorema 5.10. Para cualquier matriz A, nxn, y cualquier matriz fila X, 
ÍXn, tenemos XAX 1 —XBX* en donde B es la matriz simétrica B = $(A + A*). 

Demostración. Puesto que XAX* es una matriz lXl, es igual a su trans- 
puesta, XAX‘ = (XAX*)*. Pero la transpuesta de un producto es el producto de 
ìas transpuestas en orden inverso, por lo que (XAX 1 ) 1 = XA‘X‘. Por consiguien- 
te XAX' = | XAX‘ + i XA ( X‘ = XBX‘. 

5.13 Reducción de una forma cuadrática real a forma diagonal 

Una matriz simétrica real A es hermitiana. Por tanto, según el teorema 5.7 
es semejante a la matriz diagonal A = diag (A. lf ..., A,,), de sus autovalores. 
Además, tenemos A = C‘AC, siendo C una matriz ortogonal. Vamos ahora a 
demostrar que C puede utilizarse para convertir la forma cuadrática XAX‘ a una 
forma diagonal. 

teorema 5.11. Sea XAX‘ Una forma cuadrática asociada a una matriz si- 
métrica real A, y sea C una matriz ortogonal que convierte A en una matriz dia- 
gonal A = C‘AC. Tenemos entonces 

XAX‘ = YAY‘ = f ^yì, 

donde Y = [yi,... ,y«] es la matriz fila Y = XC, y K ..... A„ son los auto- 
valores de A. 

Demostración. Puesto que C es ortogonal tenemos C -1 = C*. Por consi- 
guiente la ecuación Y = XC implica X = YC‘, y obtenemos 

XAX* = (YC‘)A(YC‘)‘ = Y(C‘AC)Y‘ = YAY*. 

Observación: E1 teorema 5.11 se expresa diciendo que la transformación lineal 
Y = XC reduce la forma cuadrática XAX' a una forma diagonal YAY'. 

ejemplo 1. La forma cuadrática correspondiente a la matriz identidad es 


XIX* = J>? = || JV|| a , 


que es el cuadrado de la longitud del vector X = (x lf ..., x„). Una transforma- 
ción lineal Y = XC, donde C es una matriz ortogonal, nos da una nueva forma 
cuadrática YAY‘ siendo A = CIC‘ = CC‘ = I. Puesto que XIX‘ = YIY* tene- 
mos |iXj | 2 =||y|| 2 , por lo que Y tiene la misma longitud que X. Una transfor- 
mación lineal que conserva la longitud de cada vector se denomina isometría. 
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En la sección 5.19 se estudian con mayor detalle esas transformaciones. 

ejemplo 2. Determinar una matriz ortogonal C que reduzca la forma cua- 
drática Q(x) = 2x\ + 4X& + 5xl a forma diagonal. 

\2 21 

Solución. Escribamos Q(x) = XAX\ siendo + = I . Esta matriz si- 

|_2 5j 

métrica se diagonalizó en el ejemplo 1 que sigue al teorema 5.7. Tiene los auto- 
valores K = 1, A 2 = 6, y un conjunto ortonormal de autovectores u lt u 2 , siendo 
u x = t( 2, —1), u 2 = t( 1,2), t = 1/V5. Una matriz diagonalizante ortogonal es 

r 2 n 

C = / ^ ^ I. La forma diagonal correspondiente es 

YAy* = + X t y\ = y\ + 6 y\. 


E1 resultado del ejemplo 2 tiene una interpretación geométrica sencilla, re- 
presentada en la fìgura 5.1. La transformación lineal Y = XC puede considerarse 
como una rotación que aplica la base i,j en la nueva base u lt u 2 . Un punto 
que respecto a la primera base tiene coordenadas x 2 ). tiene las nuevas coorde- 
riadas (yi j y 2 ) respecto a la segunda base. Puesto que XAX* = YAY*, el conjunto 
de puntos (* lf x 2 ) que satisfacen la ecuación XAX 1 = c para un cierto c es idén- 
tico al conjunto de puntos (y 1( y 2 ) que satisfacen YAY* = c. La segunda ecuación, 
escrita en la forma y\ + 6>’| = c, es la ecuación cartesiana de una elipse si 
c>0. Por tanto la ecuación XAX*=c, puesta en la forma 2xl + 4xiX 2 + 5x| = c, 
representa la misma elipse en el sistema coordenado original. La figura 5.1 
muestra la elipse correspondiente a c = 9. 



Figura 5.1 Rotación de ejes mediante una matriz ortogonal. La elipse tiene la ecuación 
cartesiana XAX‘ — 9 en el sistema x,x 2 , y la ecuación YAY' = 9 en el sistema y,y 2 . 
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5.14 Aplicaciones a la Geometría Analitica 

La reducción de una forma cuadrática a forma diagonal puede utilizarse 
para identificar el conjunto de todos los puntos (x, y) del plano que satisface una 
ecuación cartesiana de la forma 

(5.10) ax* + bxy + cy* + dx + ey + / = 0. 

Encontraremos siempre que ese conjunto es una sección cónica, esto es, una elipse, 
una hipérbola, una parábola o uno de los casos degenerados (el conjunto vacío, 
un solo punto, o una o dos rectas). E1 tipo de cónica viene caracterizado por los 
términos de segundo grado, esto es, por la forma cuadrática ax 1 + bxy + cy 2 . 
Téngase en cuenta que aquí hemos puesto x en lugar de x x e y en lugar de x 2 . 
Volviendo a la notación anterior y expresando esa forma cuadrática como pro- 
ducto matricial 


XAX 1 = ax\ + bx{X 2 + cx |, 


siendo X — [Xl x 2 ] y A = 



Con la rotación Y = XC reducimos esa 


forma cuadrática a una forma diagonal + X^y\, donde \ lt A* son los autova- 
lores de A. Un conjunto ortonormal de autovectores u lt u s determina un nuevo 
conjunto de ejes coordenados, respecto a los cuales la ecuación cartesiana (5.10) 
se convierte en 


(5.11) hy\ + X s y\ + d'y^ + e'y 2 + / = 0, 


con nuevos coeficientes d' y e' en los términos de primer grado. En esta ecuación 
no existe término en el producto mixto y x y a , con lo cual el tipo de cónica se 
identifica fácilmente examinando los autovalores y X 2 . Si la cónica no es dege- 
nerada, la ecuación (5.11) representa una elipse si A^ tienen el mismo signo, 
una hipérbola si X lt X 2 tienen signos contrarios, y una parábola si uno de los 
dos es cero y el otro no. Los tres casos corresponden a X^ > 0, X x X 2 < 0, y 
= 0. Seguidamente damos algunos ejemplos. 

ejemplo 1. 2x 2 + 4 xy + 5 y 2 + 4x + 13y — J = 0 . Escribimos la ecua- 
ción así 

(5.12) 2x\ + 4x x x 2 + 5*£ + 4x x + 13x 2 - i = 0. 

La forma cuadrática 2x\ + 4x^2 + 5x* es la tratada en el ejemplo 2 de la sección 
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anterior. Su matriz tiene los autovalores X, = 1, A 2 = 6, y un conjunto ortonor- 
mal de autovectores u t = t(2, —1), u* = <(1,2), siendo t = l/y/s. Una matriz 

r 2 n 

diagonalizante ortogonal es C = í ^ I. Ésta reduce la parte cuadrática de 


(5.12) a la forma y\ + 6y|. Para determinar el efecto en la parte de primer grado 
ponemos la ecuación de la rotación Y = XC en la forma X = YC* y obtenemos 


= 4=[y 1 ,j'*] 2 1 , 

V 5 Ll 2J 


-jOy. + y,), 


*2 = (-J>i + 2 y t ) . 


Por consiguiente, la parte lineal 4xi + 13x 2 se transforma en 


(2^1 + y 2 ) + (—yi + 2 y 2 ) = 


-V 5 yi + 6 V 5 y*- 


La ecuación cartesiana transformada se convierte en 

yì + 6^2 — V 5 yi + 6 V 5 yi — 1 = ° • 


Completando los cuadrados en y, e y 2 escribimos ésa así: 

Oi ~ y ~5) 2 + 6(y 2 + ix/5)* = 9. 

Ésta es la ecuación de una elipse con su centro en el punto Q\/5, —^V5) en el 
sistema coordenado y,y 2 . Las direcciones positivas de los ejes y, e y 2 están deter- 
minadas por los autovectores u, y k 2 , como se indica en la figura 5.2. 

Podemos aún simplificar más la ecuación escribiendo 

z i=Ji-W5. z 2 =J 2 + iV5. 

Geométricamente, esto es lo mismo que introducir un nuevo sistema de ejes 
coordenados paralelos a los ejes y,y 2 pero con el nuevo origen en el centro de la 
elipse. En el sistema z,z 2 Ia ecuación de la elipse es sencilla 

z\ + 6z| = 9, o £i + -£Ì = i. 

9 3/2 

La elipse y los tres sistemas de coordenadas se han dibujado en la figura 5.2. 
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Figura 5.2 Rotación y.traslación de ejes coordenados. La rotación Y_= XC viene 
seguida por la traslación z t = y t - z 2 = y 2 + ^y/s. 


ejemplo 2. 2x 2 — 4xy — y 2 — 4x + lOy — 13 = 0 . Pongámosla en la 
forma 


2x\ - 4 x!X 2 -x\- 4x x + IO.X 2 - 13 = 0. 


La parte cuadrática es XAX‘, siendo A 


J 2 - 2 1. 

1-2 -U 


Esta matriz tiene los auto- 


valores Aj=3, \ 2 = —2. Un conj'unto ortonormal de autovectores es u x = t{2, —1), 
u 2 = t{ 1,2), siendo t = l/>/5. U na matriz diagonalizante ortogonal es 


r 2 r 

L-1 2 


La ecuación de la rotación X = YC * nos da 

(2+1 + l’a), x 2 = - j= (-y x + 2y 2 ). 


Por consiguiente, la ecuación transformada se convierte en 
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Completando los cuadrados en y x e y 2 obtenemos la ecuación 


3 (y x - Ìs/ìy - 2(y t - fr/5)* = 12 , 


que representa una hipérbola con centro en (|V5, |\/5) en el sistema y x y t . La tras- 
lación z x = y t — 1^5, z 2 = — |\/5 simplifica la ecuación Uegando a 

7>z\ — 2z\ = 12, o — — — = 1. 

4 6 

La hipérbola está dibujada en la figura 5.3(a). Los autovectores u x y w 2 determinan 
las direcciones positivas de los ejes y x e y 2 . 

ejemplo 3. 9x 2 + 24xy + 16y 2 — 20x + 15y =; 0 . Pongamos esta ecuación 
así: 


9x\ + 24x x x 2 + 16x1 — 20x x + 15x 2 = 0. 


La matriz simétrica para la parte cuadrática es + 


' 9 121 

. Sus autovalores son 

12 16 


+ = 25, A 2 = 0 . Un conjunto ortonormal de autovectores es u x = 1(3, 4), 
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u 2 = i(—4, 3). Una matriz diagonalizante ortogonal es C = 
tación X = YC* nos <3a 


. La ro- 


= i(3/i - 4 j 2 ) , x 2 = i(4j x + 3_y 2 ). 

Por consiguiente, la ecuación cartesiana transformada se convierte en 

25 y[ - ¥(3y x - 4 y t ) + ¥(4yx + 3 y 2 ) = 0. 

Simplifìcando esa ecuación se llega a yl + y* = 0, que es la eçuación de una pa- 
rábola con el vértice en el origen. La parábola está dibujada en la fìgura 5.3(b). 

eiemplo 4. Casos degenerados. E1 solo conocimiento de los autovalores no 
revela si la ecuación cartesiana representa una cónica degenerada, Por ejemplo, las 
tres ecuaciones x 2 + 2y 2 = 1, x* + 2y 2 = 0 y x 2 + 2y 2 = — 1 tienen los mismos 
autovalores; la primera representa una elipse no degenerada, la segunda sólo se 
satisface para (x, y) = (0,0), y la tercera representa el conjunto vacío. Las dos 
últimas pueden considerarse casos degenerados de elipse. 

La gráfìca de la ecuación y* = 0 es el eje x. La ecuación y* — 1 = 0 repre- 
senta las dos rectas paralelas y=ley=—1. Éstos pueden considerarse como 
casos degenerados de parábola. La ecuación x 2 — 4y* = 0 representa dos rectas 
que se cortan ya que se satisface si x — 2y = 0 o si x + 2y = 0 . Éste puede 
considerarse como caso degenerado de hipérbola. 

Sin embargo, si la ecuación cartesiana ax? + bxy + cy 2 + dx + ey + / = 0 
representa una cónica no degenerada, entonces el tipo de cónica puede determi- 
narse con. toda facilidad. E1 polinomio característico de la matriz de la forma 
cuadrática ax 2 + bxy + cy 2 es 

n-a -0/21 

det \=X*-(a + c)X + (ac - \b 2 ) = (X - X,)(X - X 2 ). 

l-b/2 X — cj 

Por tanto, el producto de los autovalores es 

X t X 2 = ac — \b 2 = \(4ac - b 2 ). 


Puesto que el tipo de cónica está determinado por el signo algebraico del producto 
^+ 2 , vemos que la cónica es elipse, hipérbola o parábola, según que 4 ac — b 2 sea 
positivo, negativo o nulo. E1 número 4 ac — b 2 se llama discriminante de la forma 
cuadrática ax 2 + bxy + cy 2 . En los ejemplos 1, 2 y 3 el discriminante tiene los 
valores 34, —24, y 0, respectivamente. 
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5.15 Ejercicios 

En cada uno de los ejercicios 1 al 7, hallar a) una matriz simétrica A para la forma 
cuadrática; b) los autovalores de A; c) un conjunto ortonormal de autovectores; d) una 
matriz diagonalizante ortogonal C. 


1 . 4 ^rf + 4x x x 2 + x\. 

2. x x x 2 . 

3. x\ + lx x x 2 - x\. 

4. 24x\ - 24x x x 2 + 41 jc| . 


5. x\ + x x x 2 + + x 2 x 3 . 

6. 2x\ + 4x x x 3 + x\ - x\. 

7. 3x\ + 4x^2 + 8x5X3 + 4x 2 x 3 + 3x\. 


En cada uno de los ejercicios 8 al 18, identificar la cónica representada por la ecuación 
cartesiana y hacer un dibujo. 


8. / - 2xy + 2x 2 - 5 = 0. 

9. / - 2xy + 5x =0. 

10. / - 2xy + x 2 - 5x = 0. 

11. 5x 2 -4xy +2/ -6 = 0. 

12. 19x 2 + 4xy + 16/ - 212x + 104y = 356. 

13. 9x 2 + 24x_y + 16/ - 52x + 14^ = 6. 


14. 5x* + 6x_y + 5/ —2=0. 

15. x 2 + 2xy + / — 2x + 2y + 3 =0. 

16. 2x* + 4x/ + 5/ - 2x -y - 4 = 0. 

17. x* +4xj -2/ - 12 = 0. 

18. xy +y — 2x — 2 = 0. 


19. iPara qué valor (o valores) de c la gráfica de la ecuación cartesiana 2xy-4x+7y+c=0 
será un par de rectas? 

20. Si la ecuación ax 2 + bxy + cy 2 = 1 representa una elipse, demostrar que el árca de la 
región que limita es 2irlV4ac — 6*. Esto da un significado geométrico al discriminante 
4ac - b 1 . 


* 5.16 (*) Autovalores de una transfortnación simétrica obtenidos como valores 
de su forma cuadrática 

Vamos a prescindir ahora de la exigencia de que V sea de dimensión finita 
y vamos a encontrar una relación entre los autovalores de un operador simétrico 
y su forma cuadrática. 

Supongamos que x es un autovector con norma 1 perteneciente a un autova- 
lor A, Entonces T(x) = \x con lo que tenemos 

(5.13) Q(x) = (7XX), x) = (\x, x) = X(x, x) = A, 

ya que (x, x) = 1. E1 conjunto de todos los x de V que satisfacen (x, x) = 1 se 

(*) Las secciones senaladas con asterisco pueden suprimirse o posponerse sin perjuicio 
de la continuidad del tema. 
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llama la esfera unidad de V. La ecuación (5.13) demuestra el teorema siguiente. 

teorema 5.12. Sea T: V -> V una transformación simétrica en un espacio 
euclídeo real V, y sea Q(x) = (T(x), x). Entonces los autovalores de T (si existe 
alguno) se encuentran entre los valores que Q toma en la esfera unidad de V. 

ejemplo. Sea V — V 2 (R) con la base (ij) y con el producto escalar ordi- 
nario como producto interior. Sea T la transformación simétrica con matriz 

. Entonces la forma cuadrática de T viene dada por 

Q(x) = 2 J,a ij x i x i = 4xi + 8x|. 



Los autovalores de T son = 4, A 2 = 8. Es fácil ver que esos autovalores son, 
respectivamente, los valores mínimo y máximo que toma Q en el círculo unidad 
xì + x\ = 1 . En efecto, en ese círculo tenemos 

Q(x) = 4(x* + xj) + 4x\ = 4 + 4xj > donde — 1 ^ x 2 ^ 1. 

Éste alcanza el valor mínimo, 4, cuando x 2 = 0 y el máximo, 8, cuando x t = ±1. 

La figura 5.4 muestra el círculo unidad y dos elipses. La elipse interior tiene 
como ecuación cartesiana 4x\ + 8x\ = 4. Consta de todos los puntos x = (x u x 2 ) 
del plano que satisfacen Q(x) = 4. La elipse exterior es la de ecuación 
4xl + = 8 y consta de los puntos que satisfacen Q(x) = 8. Los puntos 

(±1,0) en los que la elipse interior es tangente al círculo unidad son autovectores 
correspondientes al autovalor 4. Los puntos (0, ±1) de la elipse exterior son 
autovectores correspondientes al autovalor 8. 

E1 ejemplo anterior ilustra propiedades relativas a los extremos de los auto- 
valores que son válidos con mayor generalidad. En la sección que sigue probare- 
mos que el mínimo y el máximo autovalor (si existen) son siempre el mínimo y el 
máximo valor que Q toma en la esfera unidad. En la discusión que vamos a hacer 
de esas propiedades utilizaremos el siguiente teorema relativo a formas cuadrá- 
ticas. Debe observarse que este teorema no exige que V sea de dimensión finita. 

teorema 5.13. Sea T: V V una transformación simétrica en un espacio 
euclídeo real V con forma cuadrática Q(x) — (T(x),x). Supongamos que Q no 
cambia de signo en V. Entonces si Q(x) = 0 para un cierto x de V también te 
nemos T(x) = O. Dicho de otro modo, si Q no cambia de signo, entonces Q se 
anula solamente en el núcleo de T. 

Demostración. Supongamos que Q(x) = 0 para un cierto x de V y sea y 
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Figura 5.4 Relación geomêtrica entre los autovalores de T y los valores de Q en la 
esfera unidad, ilustrada con un ejemplo bi-dimensiortal. 

un elemento cualquiera de V. Elijamos un t cualquiera y consideremos Q(x + ty). 
Empleando la linealidad de T, la linealidad del producto interior, y la simetría 
de T, tenemos 

Q(x + ty) = (T(x + ty), x + ty) = (T(x) + tT(ý), x + ty) 

= ( T (x), x) + t(T(x), y) + t(T(y), x) + t\T(ý),ý) 

= Q(x) + 2t(T(x),ý) + t 2 Q(y) = at + bt\ 

siendo a = 2(T(x), y) y b = Q(y). Si Q es no negativa en V tenemos la des- 
igualdad 


at + Z)/ 2 > 0 para todo número real t. 


En otras palabras, el polinomio cuadrático p(t) = at + bt 2 tiene su mínimo en 
t = 0. Luego p'( 0) = 0. Pero /(0) = a = 2(T(x), y), así que (T(x), y) = 0. Pues- 
to que y es arbitrario, podemos tomar en particular y = T(x), dando 
(T(x), T(x))= 0. Esto demuestra que T(x) = O . 

Si Q es no positiva en V tenemos p(t) = at + bt 2 ^ 0 para todo t, así que p 
tiene su máximo en t = 0, y por tanto p'(O) = 0 como antes. 

* 5.17 Propiedades relativas a extremos de los autovalores de una transformación 
simétrica 

Demostraremos ahora que los valores extremos de una forma cuadrática en la 
esfera unidad son autovalores. 


teorema 5.14. Sea T: V V una transformación lineal simétrica en un es- 
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pacio euclídeo real V, y sea Q{x) = (T(x), x). Entre todos los valores que Q toma 
en la esfera unidad, supongamos que existe un extremo (*) (máximo o mínimo) 
en un punto u en el que (u, u) = 1. Entonces u es un autovector para T; el corres- 
pondiente autovalor es Q(u), valor extremo de Q en la esfera unidad. 

Demostración. Supongamos que Q tiene un mínimo en u. Tenemos entonces 

(5.14) Q(x) > Q(u) para todo x que cumpla (x, x) = 1. 

Sea A = Q(u). Si (x,x) = 1 tenemos Q(u) = A(x, x) = (Aac.x) así que la des- 
igualdad (5.14) puede ponerse así 

(5-15) (7’(ac), jc) > (Aac, jc) 

con tal que (x, x) = 1. Demostremos ahora que (5.15) es válido para todo x de 
V. Supongamos que |ijcji = a. Entonces x = ay, siendo ||yj| = 1. Luego 

(T(x), x) = (T(ay), aý) = a\T(ý), ý) y (Xx, x) = a\Xy, ý). 

Pero (T(y),y) - (Ay, y) ya que (y, y) = 1. Multiplicando ambos miembros de esta 
desigualdad por a 2 llegamos a (5.15) para x = ay. 

Puesto que (T(x), x) - (Á.x, x) = (T(x) - \x, x), podemos poner la desigual- 
dad (5.15) en la forma (T(x) — \x,x) ^ 0, o 

(5.16) (S(*), x) > 0, donde S=T-XI. 

Cuando x = u tenemos la desigualdad (5.14) y por tanto también (5.16). La 
transformación lineal S es simétrica. La .desigualdad (5.16) establece que la 
forma cuadrática Qi dada por Qdx) = (S(x), x) es no negativa en V. Cuando 
x = u tenemos Q,(x) = 0. Por consiguiente, según el teorema 5.13 debe ser 
S(u) = O. Dicho de otro omdo, T(u) = \u, así que u es un autovector para T, 
y A = Q(u) es el correspondiente autovalor. Esto completa la demostración si Q 
tiene un mínimo en u. 

Si existe un máximo en u todas las desigualdades de la demostración anterior 
se invierten y aplicamos el teorema 5.13 a la forma cuadrática no positiva Q x . 

(*) Si V es de dimensión infìnita, la forma cuadrática Q no tìene necesariamente un 
extremo en la esfera unidad. Este será el caso cuando T no tiene autovalores. En el caso 
de dimensión finita, Q tiene siempre un máximo y un mínimo en algún punto de la esfera 
unidad. Esto resulta como una consecuencia de un teorema más general sobre los valores 
extremos de funciones continuas. En la sección 9.16 puede verse un caso particular de ese 
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* 5.18 Caso de dimensión finita 

Supongamos ahora que dim V = n. Entonces T tiene n autovalores reales 
que pueden disponerse en orden creciente 

h < K < ■ ■ ■ < K- 

De acuerdo con el teorema 5.14, el menor autovalor A, es el mínimo de Q en la es- 
fera unidad, y el mayor autovalor es el máximo de Q en la esfera unidad. Demos- 
traremos seguidamente que los autovalores intermedios también se presentan como 
valores extremos de Q, restringidos a ciertos subconjuntos de la esfera unidad. 

Sea Uj un autovector en la esfera unidad que minimiza Q. Entonces 
Ai = Q(Ui). Si A es un autovalor distinto de X x cualquier autovector correspon- 
diente a A debe ser ortogonal a u x . Por consiguiente, es natural buscar como tal 
un autovector en el complemento ortogonal del subespacio engendrado por «i. 

Sea S el subespacio engendrado por u x . E1 complemento ortogonal S- 1 - 
consta de todos los elementos de V ortogonal a u x . En particular, S-L contiene 
todos los autovectores correspondientes a los autovalores A#Ai. Es fácil com- 
probar que dim S-L = n — 1 y que T aplica S-L en sí mismo (*). Designemos 
por S n -i la esfera unidad en el subespacio S-L de dimensión n — 1. (La esfera 
unidad S n -i es un subconjunto de la esfera unidad en V.) Aplicando el teorema 
5.14 al subespacio S-L encontramos que A 2 = Q(« 2 ), donde « 2 es un punto que 
hace mínimo Q en S n -i. 

E1 siguiente autovector A 3 puede obtenerse en forma parecida como el valor 
mínimo de Q en la esfera unidad S n _ 2 en el espacio de dimensión n — 2 que 
consta de aquellos elementos ortogonales simultáneamente a u t y u 2 . Continuando 
en esta forma encontramos que cada autovalor A*. es el valor mínimo que toma 
Q en una esfera unidad S n -k+i en un subespacio de dimensión n — k + 1. E1 
mayor de esos mínimos, A„, es también el máximo valor que toma Q en cada una 
de las esferas S n -*+i. E1 correspondiente conjunto de autovectores u x ,,u n 
forma una base ortonormal para V. 

5.19 Transformaciones unitarias 

Concluimos este capítulo con una breve discusión de otro tipo importante 
de transformaciones llamadas unitarias. En el caso de dimensión finita están 
representadas por matrices unidad. 

definición. Sean È un espacio euclídeo y V un subespacio de E. Una 
transformación T:V -> E se llama unitaria en V si tenemos 

(T(x), T(y)) = (x,y) para todo par x, y de V. (5.17) 

(*) Esto se hizo en la demostración del teorema 5.4, sección 5.6. 
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Cuando E es un espacio euclídeo real, una transformación unitaria también se 
denomina transformación ortogonal. 

La ecuación (5.17) se expresa diciendo que T conserva los productos inte- 
riores. En consecuencia, es natural esperar que T también conserve la ortogo- 
nalidad y las normas, pues éstas se derivan de los productos interiores. 

teorema 5.15. Si T: V -> E es una transformación unitaria de V, enton- 
ces para todo par x,y de V tenemos 

a) (x, y) — 0 implica (T(x), T(y)) = 0 (T conserva la ortogonalidad). 

b) ||T(*)|| = ||xl| (T conserva las normas). 

c) ||T(x) — T(y)|| = \\x — y|| (T conserva las distancias). 

d) T es invertible, y T -1 es unitaria en T(V). 

Demostración. La parte a) es consecuencia inmediata de la ecuación (5.17). 
La parte b) se deduce haciendo x = y en (5.17). La parte c) resulta de b) porque 
T(x) - T(y) = T(x - y). 

Para demostrar d) aplicamos b) lo que hace ver que T(x)=0 impíica x=0, 
así que T es invertible. Si x e T(V) e y e T(V) podemos escribir x = T(u), 
y = T(v). con lo que tenemos 

(7^ l (x), T _1 (y)) = ( u, v) = (T(m), T(v)) = (x,y). 

Por io tanto T -1 es unitaria en T(V). 

En cuanto a los autovalores y autovectores tenemos el teorema siguiente. 

teorema 5.16. Sea T: V -* E una transformación unitaria en V. 

a) Si T tiene un autovalor A, entonces |A| = 1. 

b) Si x e y son autovectores correspondientes a autovalores distintos Aji/i, 
entonces x e y son ortogonales. 

c) SiV = E y dim V = n, y si V es un espacio complejo, existen los auto- 
vectores u y ,. .. ,u„ de T que forman una base ortonormal para V. La 
matriz de T relativa a esa base es ía matriz diagonal A = diag (A. lf .. . A,), 
siendo À* el autovalor correspondiente a ut. 

Demostración. Para demostrar a), sea x un autovector correspondiente a A. 
Entonces i^Oy T(x) = \x. Haciendo y = x en la ecuación (5.17) llegamos a 

(Àx, Àx) = (x, x) o ÀÀ(x, x) = (x, x). 


Puesto que (x,x) > 0 y Xk = |A| 2 , esto implica ]A| = 1 . 
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Para demostrar b), escribamos T(x) = \x, T(y) = ny y calcularemos el pro- 
ducto interior (T(x), T(y)) de dos maneras. Tenemos 

(T(x), T(y)) = (x,y) 

ya que T es unitaria, Asimismo 

(T(x), T(y)) = (Xx, pý) = XfL(x,y) 

ya que x e y son autovectores. Por consiguiente Xfl(x, j) = (x,y), así que (x, y) = 0 
salvo si Xp, = 1. Pero Al = 1 según a), por lo que si fuera Xp, = 1 debería ser 
Xl = Xp, l = p, A = p , lo que contradice la hipótesis de que \ y //. son dis- 
tintos. Por consiguiente Xp # 1 y (x, y) = 0. 

E1 apartado c) se demuestra por inducción respecto de n en forma muy pare- 
cida al teorema 5.4, que da el resultado análogo para los operadores hermitianos. 
E1 único cambio necesario afecta a la parte de la demostración que afìrma que T 
aplica S-L en sí mismo, donde 

S x = {x|xeF, (x, Ul ) = 0}. 

Aquí Ui es un autovector de T con el autovalor ^ . A partir de la ecuación 
T( Ul ) = \ lUì encontramos 


Mi = tfnuj = x,t( Ul ) 

ya que X.J.^ = [AJ 2 = 1. Elijamos ahora un x cualquiera en S- 1 - y observemos que 

. (T(x), Ul ) = (T(x), X^uJ) = XJTix), T( Ul )) = XJx, Ul ) = 0. 

Luego T(x) e S 1 si x e S x , por lo cual T aplica S- 1 - en sí mismo. E1 resto de 
la demostración es idéntico a la del teorema 5.4, por lo que no lo repetiremos. 

Los dos teoremas que siguen se refieren a propiedades de las transformaciones 
unitarias en espacios de dimensión finita. Damos tan sólo un bosquejo de las 
demostraciones. 

teorema 5.17. Supongamos que diín V = n y sea E = (e t ,... ,e„) una 
base para V fijada. La transformación lineal T: V V es unitaria si y sólo si 


( 5 . 18 ) 


(T(e t ), T(e)) = (e { , e) para todo par i ,}. 
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En particular, si E es ortonormal entonces T es unitaria si y sólo si T aplica E en 
una base ortonormal. 

Esbozo de la demostración. Pongamos x = XìCí, y = 2 y,e,-. Tenemos en- 
tonces 

(*. y) = (ivi. Zj'a) = i i^ŷi(e.-, e a ), 
y 

(T(x), T(y)) = (|x < T(e i ),|y J T( eí )) = Ì |x i ŷ J (T(e i ), T( Cj )). 


A continuación se compara (x, y) con (T(x), T(y)). 

teorema 5.18. Supongamos que dim V = n y sea ,e„) una base 

ortonormal para V. Sea A = (ay) la representación matricial de una transformación 
lineal T: V -> V relativa a esa base. Entonces T es unitaria si y sólo si A es uni- 
taria, esto es, si y sólo si 

(5-19) a*A = /. 

Esbozo de la demostración. Puesto que (e,-, ef) es el elemento ij de la matriz 
identidad, la ecuación (5.19) implica 

(5.20) (e ( , ej =J,â ki a kj =j>_a ki â kj . 

Puesto que A es la matriz de T tenemos T (e,) = t a ki e k , T(e 3 ) = 2” =1 o Tj e T con 
lo cual 

(T( e t), T(e s )) = (ỳ,a ki e k ,2a Tj e^ = j, fa ki â Tj (e k , e r ) =fa ki â k} . 


Se compara luego con (5.20) y se aplica el teorema 5.17. 

teorema 5.19. Toda matriz unitaria A tiene las propiedades siguientes: 

a) A es no singular y A -1 = A*. 

b) Cada una de las matrices A\ Â y A* es unitaria. 

c) Los autovalores de A son números complejos de valor absoluto 1. 

d) |detA| = 1; si A es real, entonces det A = ±1. 


La demostración del teorema 5.19 se deja como ejercicio para el lector. 
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5.20 Ejercicios 

1. a) Sea T:V —» V la transformación dada por T(x) = cx, donde c es un escalar fijado. 
Demostrar que T es unitaria si y sólo si |c| = 1 . 

b) Si V es unidimensional, demostrar que las únicas transformaciones unitarias en V 
son las descritas en a). En particular, si V es un espacio real unidimensional, existen 
sólo dos transformaciones ortogonales, T(x) = x y T(x) = —x. 

2. Demostrar cada una de las proposiciones.relativas a una matriz A, nXn, real orto- 
gonal 

a) Si X es un autovalor real de A, entonces X=lóX=— 1. 

b) Si X es un autovalor complejo de A, el complejo conjugado A también es autovalor 
de A . Es decir, los autovalores de A no reales son conjugados a pares. 

c) Si n es impar, A tiene por lo menos un autovalor real. 

3. Sea V un espacio euclídeo real de dimensión n. Una transformación ortogonal T: V —> V 
con determinante igual a 1 se llama rotación. Si n es impar, demostrar que 1 es auto- 
valor para T. Esto prueba que toda rotación de un espacio de dimensión impar tiene 
un eje fijo. [ Indicación: Aplicar el ejercicio 2.] 

4. Dada una matriz real ortogonal A con — 1 como autovalor de multiplicidad k. Demostrar 
que det A = ( — 1)*. 

5. Si T es lineal y conserva la norma, demostrar que T es unitaria. 

6. Si T: V —> V es unitaria y hermitiana, demostrar que T 2 = 1. 

7. Sean (e,,..., e„) y u„) dos bases ortonormales para un espacio euclídeo V. 

Demostrar que existe una transformación unitaria T que aplica una de esas bases en 
la otra. 

8. Hallar un número real a tal que la siguiente matriz sea unitaria: 

'a \i }a(2/ - 1)- 
ia 1(1 + i) }a(l - í) . 
a -1 \a(2-i)_ 

9. Si A es una matriz hemi-hermitiana, demostrar que I — A e I + A son no singulares 
y que (I — A)(I + A)~ l es unitaria. 

10. Si A es una matriz unitaria y si I + A es no singular, demostrar que (I — A)(I + A)~' 
es hemi-hermitiana. 

11. Si A es hermitiana, demostrar que A — U es no singular y que ( A — H)~'(A + il) es 
unitaria. 

12. Demostrar que cualquier matriz unitaria puede diagonalizarse con una matriz unitaria. 

13. Una matriz cuadrada se llama normal si AA* = A*A. Determinar cuál de los tipos 
sigùientes de matrices son normales. 

a) Matrices hermitianas. d) Matrices hemi-simétricas. 

b) Matrices hemi-hermitianas. e) Matrices unitarias. 

c) Matrices simétricas. f) Matrices ortogonales. 

14. Si A es una matriz normal (AA* = A*A) y si U es una matriz unitaria, demostrar que 

U*AU es normal. 
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ECUACIONES DIFERENCIALES LINEALES 


6.1 Introducción histórica 

La historia de las ecuaciones diferenciales comenzó en el siglo xvii cuando 
Newton, Leibniz y los Bernoulli resolvieron algunas ecuaciones diferenciales sen- 
cillas de primero y segundo orden que se presentaron en problemas de Geometría 
y Mecánica. Estos primeros descubrimientos, iniciados alrededor de 1690, hicieron 
creer que las soluciones de todas las ecuaciones diferenciales originadas en pro- 
blemás geométricos y físicos podrían expresarse por medio de las funciones ele- 
mentales del Cálculo. Por ello, gran parte de los primeros esfuerzos fueron 
orientados al desarrollo de técnicas ingeniosas para resolver ecuaciones diferen- 
ciales por medio de recursos sencillos, como son la adición, sustracción, multipli- 
cación, división, composición e integración, aplicadas tan sólo un número finito 
de veces a las funciones ordinarias del Cálculo. 

Los métodos especiales, tales como la separación de variables y el empleo de 
factores integrantes.fueron ideados de manera más o menos casual antes de fines 
del siglo xvii. Durante el siglo xvm, fueron desarrollados procedimientos más 
sistemáticos, principalmente por Euler, Lagrange y Laplace. Pronto se vio que 
relativamente pocas ecuaciones diferenciales podían resolverse con recursos ele- 
mentales. Poco a poco, los matemáticos fueron dándose cuenta que era vano 
empeno el intentar descubrir métodos para resolver todas las ecuaciones diferen- 
ciales. En lugar de ello, encontraron más provechoso averiguar si una ecuación 
diferencial dada, tenía o no solución y, cuando la tenía, intentar la deducción de 
propiedades de la solución a partir de la misma ecuación diferencial. Con ello, 
los matemáticos empezaron a considerar las ecuaciones diferenciales como fuentes 
de nuevas funciones. 

A principios del siglo xix se desarrolló una fase importante de esa teoría, 
siguiendo una tendencia paralela a la de conseguir un desarrollo más riguroso del 
Cálculo. En 1820, Cauchy obtuvo el primer «teorema de existencia» para las 
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ecuaciones diferenciales. Demostró que toda ecuación de primer orden de la forma 
/ =f(x,y) 

tiene solución, siempre que el segundo miembro, f(x, y), satisfaga ciertas condi- 
ciones generales. Un ejemplo importante es la ecuación de Ricatti 

y' =P(x)y 2 + Q(x)y + R(x), 

en la que P, Q y R son funciones dadas. E1 trabajo de Cauchy implica la existen- 
cia de una solución de la ecuación de Ricatti en cualquier intervalo abierto (— r, r) 
en torno al origen, con tal que P, Q y R admitan desarrollos en serie de potencias 
en ( — r, r). En 1841 José Liouville (1809-1882) demostró que en algunos casos 
esa solución no puede obtenerse con medios elementales. 

La experiencia ha puesto de manifìesto que es difícil obtener resultados de 
tipo general relativos a las soluciones de las ecuaciones diferenciales, salvo para 
unos pocos tipos. Entre éstos cabe citar las llamadas ecuaciones diferenciales 
lineales que se presentan en gran número de problemas científìcos. En el Volu- 
men I se estudiaron algunos tipos sencillos, las ecuaciones lineales de primer 
orden y las de segundo orden con coeficientes constantes. La siguiente sección se 
dedica a una revisión de los principales resultados relativos a esas ecuaciones. 


6.2 Revisión de los resultados relativos a las ecuaciones de primero y segundo 
orden 

Una ecuación diferencial lineal de primer orden es de la forma 
(6.1) y' + P(x)y = Q(x)» 

donde P y Q son funciones dadas. En el Volumen I demostramos un teorema de 
existencia y unicidad para esa ecuación (teorema 8.3) que aquí volvemos a 
enunciar. 

teorema 6.1. Supongamos que P y Q son continuas en un intervalo abierto 
J. Elijamos cualquiér punto a en ] y sea b un número real cualquiera. Entonces 
existe una y sólo una función y = f(x) que satisface la ecuación diferencial (6.1) 
y la condición inicial .f(a) = b. Esa función viene dada por la fórmula 

(6:2) f(x) = be~ Mx) + e~ Mxì J* Q(t)e AM dt, 

donde A(x) = ] x P(t) dt. 
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Las ecuaciones lineales de segundo orden son las de la forma 


Po(x)y" + PAx)y' + P 2 (x)y = R(x). 


Si los coeficientes P 0 , Pi, P s y el segundo miembro R son continuas en un cierto 
intervalo /, y si P 0 no es nulo en ningún punto de /, un teorema (que se discute 
en la sección 6.5) garantiza que siempre existen soluciones en el intervalo /. Sin 
embargo, no existe una fórmula general análoga a la (6.2) para expresar esas 
soluciones en función de P 0 , Pi, P 2 y R. Así pues, en esta generalización relativa- 
mente sencilla de (6.1), la teoría no es ni mucho menos completa, excepto en 
casos particulares. Si los coeficientes son constantes y si R es cero, todas las so- 
luciones pueden determinarse explícitamente por medio de polinomios y funciones 
exponenciales y trigonométricas según afirma el siguiente teorema que se demos- 
tró en el Volumen I (teorema 8.7). 

teorema 6.2. Consideremos la ecuación diferencial 

(6.3) y" + ay' + by = 0, 

donde a y b son constantes reales dadas. Sea d = a 2 — 4b. Toda solución de 

(6.3) en el intervalo (— °°, +°°) tiene la forma 

(6.4) y = e-‘“ /í [c 1 « 1 (x) + c 2 m 2 (x)] , 

donde c^ y c 2 son constantes, y las funciones u 2 y u? se determinan de acuerdo 
con el signo algebraico de d como sigue: 

a) Si d = 0, u 2 (x) = 1 y u 2 (x) — x. 

b) Si d > 0, Ui(x) = e kx y u 2 (x) = e~ k *, donde k = \4d. _ 

c) Si d < 0, u 2 (x) = cos kx y u 2 (x)+= sen kx, donde k = \yj—d 

E1 número d = a 2 — 4b es el discriminante de la forma cuadrática 

(6.5) r* + ar + b = 0. 

Ésta es la llamada ecuación característica de la ecuación diferencial (6.3). Sus raí- 
ces son 


r _ -a + Vd 
1 2 


—a — \Jd 


r 2 = 


2 
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E1 signo de d determina la naturaleza de esas raíces. Si d > 0 ambas raíces son 
reales y la solución de (6.4) puede expresarse en la forma 

y = c l é riX + c 2 e rtx . 

Si d < 0, las raíces r, y r 2 son números complejos conjugados. Cada una de las 
funciones exponenciales complejas f t (x) = e r ' x y f 2 (x) = e r ' x es una solución com- 
pleja de la ecuación diferencial (6.3). Obtenemos soluciones reales examinando las 
partes real e imaginarias de f t y f 2 . Escribiendo r x = — \a + ik, r 2 = —\a — ik , 
siendo k = —d, tenemos 

/j(x) = e riX = fr axlz e l1cx = e~ ax12 cos kx + ie~ ax/ì senfcx 

y 

f 2 (x) = e r * x = e~ ax/2 e ,kx = e~ ax/2 cos kx — ie ax/2 senkx. 

La solución general que aparece en la ecuación (6.4) es una combinación lineal 
de las partes real e imaginaria de f t (x) y f 2 (x). 

6.3 Ejercicios 

Estos ejercicios han sido seleccionados del' capítulo 8 del volumen I y constituyen una 
revisión sobre las ecuaciones diferenciales de primero y segundo orden. 

Ecuaciones lineales de primer orden. En los ejercicios 1, 2, 3, resolver el problema de 
valores iniciales en el intervalo que se cita. 


1. y' — 3y = é“ en (— «, + °°), con y = 0 cuando x = 0. 

2. xy’ — 2y = x ! en (o, +«>), con y = 1 cuando x = 1. 

3. y' +y tan x = sen 2x en (— \ir, \+), con y — 2 cuando x = 0. 

4. Si una cepa de bacterias crece proporcionalmente a la cantidad de individuos presente 
y si la población se dobla en una hora, icuánto crecerá al cabo de dos horas? 

5. Una curva de ecuación cartesiana y = f(x) pasa por el origen. Por un punto arbitrario 
de la curva se trazan rectas paralelas a los ejes coordenados que forman un rectánguio 
con ellos. La curva divide todo rectángulo de esos en dos regiones A y B, una de las 
cuales tiene un área igual a n veces la otra; Hallar la función f. 

6. a) Sea u una solución no nula de la ecuación de segundo orden y"+ P(x)y’ f Q(x) y = 0. 
Demostrar que la sustitución y = uv convierte la ecuación 

y ' + P(x)y + Q(x)y = R(x) 

en una ecuación lineal de primer orden en v'. 

b) Obtener una solución no nula de la ecuación y" — 4y' + x 2 (y’ — 4y) = 0 por simple 
inspección y emplear el método de la parte a) para encontrar una solución de 


/ - 4/ + x 2 (y - 4y) = Ixer^ 
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tal que y = 0 e y' = 4 cuando x = 0. 

Ecuaciones lineales de segundo orden con coeficientes constantes. En cada uno de los 
ejercicios del 7 al 10, hallar todas las soluciones en (-», +<»). 


7. y" t- 4y = 0. 9. y" - 2/ + Sy = 0. 

8. y" + 4y = 0,. 10. y" + 2y' + y = 0. 


11. Hallar todos los valores de la constante k tales que la ecuación diferencial y" + ky = 0 
admita una solución no trivial y = fk(x) para la que /»(0) = /*(1) = 0. Para cada uno 
de esos valores de k, determinar la correspondiente solución y = f t (x). Considerar los 
valores de k positivos y negativos. 

12. Si (a, b) es un punto dado del plano y m es un número real dado, demostrar que la 
ecuación diferencial y" + k 2 y = 0 tiene exactamente una solución cuya gráfica pasa por 
el punto (a, b) y tiene en él pendiente m. Discutir separadamente el caso k = 0. 

13. En cada caso, hallar una ecuación diferencial lineal de segundo orden que se satisfaga 
con Ui y Uj. 

a) Ui(x) = e x , ujx) = e~ x . 

b) «iW = e 2x , u 2 (x) = xe 2x . 

c) Uk(x) = e~ x/2 cos x , u 2 (x) = e~ x/2 sen x:. 

d) u x (x) = sen (2x + 1), u 2 (x) = sen (2x + 2). 

e) «i( x) = cosh x, u 2 (x) = senh x. 

14. Una partícula está sometida a movimiento armónico simple. Inicialmente está situada en 
el punto 1, su velocidad es 1 y su aceleración es —12. Calcular su posición y aceleración 
cuando la velocidad sea Vfi 


6.4 Ecuaciones diferenciales lineales de orden n 

Una ecuación diferencial lineal de orden n es de la forma 

(6.6) P 0 (x)y {n) + P 1 (x)j <B - 1) + • • • + P n (x)y = R(x). 

Las funciones P 0 ,Pi,... ,P„ que multìplican las diversas derivadas de la función 
incógnita y se llaman coeficientes de la ecuación. En nuestra discusión general de 
la ecuación lineal supondremos que todos los coeficientes son funciones continuas 
en un cierto intervalo /. La palabra «intervalo» se referirá a un intervalo acotado 
o no acotado. 

En la ecuación diferencial (6.6) el coeficiente P 0 desempena un papel especial, 
puesto aue determina el orden de la ecuación. Los puntos en los que P 0 (x) = 0 
se llaman puntos singulares de la ecuación. La presencia de puntos singulares in- 
troduce, algunas veces, complicaciones que requieren un estudio especial. Para 
evitarlas supongamos que la función P 0 nunca- es cero en /. Entonces podemos 
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dividir ambos miembros de la ecuación (6.6) por P 0 y escribir la ecuación dife- 
rencial con primer coeficiente igual a 1. Por consiguiente, en nuestra discusión 
general supondremos que la ecuación diferencial tiene la forma 

(6.7) y w + P 1 (% (n - 1) + • • • + P n (x)y = R(x). 

E1 estudio de las ecuaciones lineales puede simplificarse mediante el uso de 
la notación de operadores. Designemos con <4 (/) el espacio lineal constituido por 
todas las funciones de valores reales, continuas en un intervalo /, y con <4 ”(/) el 
subespacio de todas las funciones / cuyas n primeras derivadas f , f ’,..., /< n) 
existen y son continuas en /. Sean P, ,.. ., P„,n funciones dadas en <ê (/) y con- 
sideremos el operador L: &*(]) -*<&(]) dado por 


L(f) =/<"> + Pji-v + • • • + P n f. 

E1 operador L a veces se escribe así: 

L — D n + P 1 D n ~ 1 + • • • + P„, 

donde D k representa el operador derivada fc-ésima. Con esa notación la ecuación 
diferencial (6.7) puede escribirse como sigue 

(6.8) L(y) = R. 

Una solución de esta ecuación es cualquier función y de ^ "(/) que satisfaga (6.8) 
en el intervalo /. 

Es fácil comprobar que L(y y + y 2 ) =L(y t ) + L( y 2 ), y que L(cy) = cL(y) 
cualquiera que sea la constante c. Por lo tanto L es un operador lineal. Por ello 
la ecuación L(y) = R se denomina lineal. E1 operador L se llama operador dife- 
rencial lineal de orden n. 

A cada ecuación lineal L(y) = R podemos asociar la ecuación 

£00 = 0 , 

en donde el segundo miembro se ha sustituido por cero. Esta se llama ecuación 
homogénea correspondiente a L(y) = R. Cuando R no es idénticamente cero, la 
ecuación L(y) = R es una ecuación no homogénea. Encontraremos que siempre 
podemos resolver la ecuación no homogénea si nos es posible resolver la corres- 
pondiente ecuación homogénea. Por consiguiente, comenzaremos estudiando las 
homogéneas. 

E1 conjunto de soluciones de la ecuación homogénea es el núcleo N(L) del 
operador L. Éste se llama también el espacio solución de la ecuación. E1 espacio 
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solución es un subespacio de r £ n (J). Si bien <ê n (J) es de dimensión infinita, 
resulta que el espacio solución N(L) siempre es de dimensión finita. En efecto, 
demostraremos que 

(6.9) dim N(L) = n , 

siendo n el orden del operador L. La ecuación (6.9) es el llamado teorema de 
dimensionalidad para los operadores diferenciales lineales. E1 teorema de di- 
mensionalidad se deducirá como consecuencia de un teorema de existencia y 
unicidad que a continuación comentamos. 

6.5 Teorema de existencia y unicidad 

TEOREMA 6.3. TEOREMA DE EXISTENCIA Y UNICIDAD PARA ECUACIONES LI- 

neales de orden n. Sean P u P 2 ,... ,P„ funciones continuas en un intervalo 
abierto J, y sea L el operador diferencial lineál 

L = D n + .P 1 0 n - 1 + • • • + P„. 

Si x 0 e J y si k 0 , k lt ..., k„- t son n números reales dados, existe entonces una 
y sólo una función y = f(x) que satisface la ecuación diferencial homogénea 
L(y) = 0 en J y que también satisface las condiciones iniciales 

/(*o) = k 0 ,f'(x 0 ) = k lt ... ,/<"-»(x 0 ) = k n - t . 

Observación: E1 vector del n-espacio dado por (/'(x 0 ),/'(x c ). /'"-‘'(jc 0 )) se llama 

vector-valor inicial de / en x 0 . E1 teorema 6.3 nos dice que si elegimos un punto x 0 
en / y un vector en el w-espacio, la ecuación homogénea L(y) = 0 tiene exacta- 
mente una solución y =f(x) en / con aquel vector como valor inicial en x 0 . Por 
ejemplo, cuando n = 2 existe exactamente una solución con valor asignado f(x 0 ) y 
derivada asignada f'(x 0 ) en el punto x 0 . 

La demostración del teorema de existencia y unicidad se obtendrá como 
corolario de los teoremas de existencia y unicidad más generales que se estudian 
en el capítulo 7. En la sección 7.9 se estudia otra demostración para el caso de 
ecuaciones con coeficientes constantes. 

6.6 Dimensión del espacio solución de una ecuación lineal homogénea 

TEOREMA 6.4. TEOREMA DE DIMENSIONALIDAD. Sea L’. <g n (J) <g(J) Un 
operador diferencial lineal de orden n dado por 

(6.10) L = D n + PjD" -1 H- + P n . 
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Entonces el espacio solución de la ecuación L(y) = 0 tiene dimensión n. 

Demostración. Sea V„ el espacio lineal n-dimensional de las n-plas de esca- 
lares. Sea T la transformación lineal que aplica cada función f del espacio solu- 
ción N(L) en el vector-valor inicial de f en x 0t 

T(f) = (f(x 0 ),f'(x 0 ),... o)), 

siendo x 0 un punto fìjo en /. E1 teorema de unicidad nos dice que T(f) = 0 
implica que / = 0. Por consiguiente, según el teorema 2.10, T es uno a uno 
en N(L). Luego T -1 también es uno a uno y aplica V„ en N(L), y el teorema 
2.11 demuestra que dim N(L) = dim V„ = n. 

Puesto que el espacio solución tiene dimensión n, un conjunto cualquiera 
de n soluciones independientes servirá de base. Por consiguiente, como corolario 
del teorema de dimensionalidad tenemos: 

teorema 6.5. Sea L: #"(./)-»•#(./) un operador diferencial lineal de 
orden n. Si u t ,.. , u„ son n soluciones independientes de la ecuación diferenciál 
homogénea L(y) = 0 en /, toda solución y = f(x) en / puede expresarse en la 
forma 

(6.11) /(*) =Ìc*u*(x), 

k=í\ 

siendo c lt ... ,c„ constantes. 

Observación: Puesto que todas las soluciones de la ecuación diferencial L(y) = 0 
están contenidas en la fórmula (6.11), la combinación lineal del segundo miembro, 
con las constantes arbitrarias Ci,..., c n a veces se llama solución general de la 
ecuación diferencial. 

E1 teorema de dimensionalidad nos dice que el espacio solución de una 
ecuación diferencial lineal homogénea de orden n tiene siempre una base de n 
soluciones, pero no nos dice cómo se determina esa base. En realidad, no se 
conoce un método sencillo para determinar una base de soluciones para toda 
ecuación lineal. No obstante, se han ideado métodos especiales para casos par- 
ticulares. Entre éstos cabe considerar las ecuaciones diferenciales con coeficientes 
constantes que volvemos ahora a considerar. 

6.7 Álgebra de operadores de coeficientes constantes 

Un operador A de coeficientes constantes es un operador lineal de la forma 
A = a 0 D n + ai D ní + • • • + a^D + a n , 


( 6 . 12 ) 
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donde D es el operador derivada y a a , a lt ..., a» son constantes reales. Si a„ 0 
el operador se llama de orden n. E1 operador A puede aplicarse a cualquier 
función y con n derivadas en un cierto intervalo, siendo el resultado una fun- 
ción A(y) dada por 


A(y) = a 0 y w + a 1 / n_ ' 1) + • • • + a„_j/ + a n y . 

En esta sección, limitamos nuestro estudio a funciones que tienen derivadas de 
cualquier orden en (— oo, + oo). E1 conjunto de tales funciones se designará 
con y se le llamará clase de las funciones indefinidamente derivables. Si 
yef”, entonces A(y) pertenece también a ^ 00 , 

Las operaciones algebraicas corrientes con las transformaciones lineales 
(adición, multiplicación por escalares, y composición o multiplicación) pueden 
aplicarse, en particular, a los operadores con coeficientes constantes. Sean A y B 
dos operadores con coeficientes constantes (no necesariamente del mismo orden). 
Puesto que la suma A + B y todos los productos A+ son también operadores con 
coeficientes constantes, el conjunto de todos los operadores con coeficientes cons- 
tantes es un espacio lineal. E1 producto de A por B (en cualquier orden) es 
también un operador con coeficientes constantes. Por consiguiente, las sumas, 
productos y productos por escalares de operadores con coeficientes constantes 
satisfacen las leyes conmutativa, asociativa y distributiva ordinarias que cumplen 
todas las transformaciones lineales. Asimismo, puesto que D r D e = D s D r para 
todos los enteros positivos r y s, dos operadores con coeficientes constantes cua- 
lesquiera A y B son permutables; AB = BA. 

A cada operador con coeficientes constantes A asociamos un polinomio Pa 
llamado polinomio característico de A. Si A viene dado por (6.12), p A es el poli- 
nomio que tiene los mismos coeficientes que A. Esto es, para todo r real tenemos 

Pa(T> = Í V" + + •*■ + «.. * 

Recíprocamente, dado un polinomio real cualquiera p, existe un correspondiente 
operador A cuyos coeficientes son los mismos que los de p. E1 siguiente teorema 
muestra que tal asociación entre operadores y polinomios es una correspondencia 
uno a uno. Además, esta correspondencia asocia a sumas, productos de operadores 
y productos de escalares por operador las respectivas sumas, productos y produc- 
tos por escalares de sus polinomios característicos. 

teorema 6.6. Sean A y B dos operadores con coeficientes constantes con 
polinomios característicos respectivos p A y p B , y A un número real. Entonces te- 
nemos: 

a) A = B si y sólo si p A = Pb, 

b) p A+ B = Pa + Pb, 

c) Pab = p A • Pb, 

d) p AA = A • p A . 
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Demostración. Consideremos primero la parte a). Supongamos p A = Pb. 
Queremos demosírar que A(y) = B(y) para toda y de fé’ 00 . Puesto que p A = ps, 
ambos polinomios tienen el mismo grado y los mismos coeficientes. Por consi- 
guiente AyB tienen el mismo orden y los mismos coeficientes, así que A(y) = B(y) 
para toda y de #°°. 

Seguidamente demostramos que A = B implica p A = p B . La relación A = B 
significa que A(y) = B(y) para toda y de < íf° 0 . Tomemos y = e rx , siendo r una 
constante. Puesto que y (k) = r Jc e rx para todo k ^ 0, tenemos 

^00 = PAÌ r )e rx . y B(ý)=p s (r)e ri . 

La ecuación A(y) = B(y) implica p A (r) = p a (r). Ya que r es cualquiera, debe ser 
p A = p B . Esto completa la demostración de la parte a). 

Las partes b), c) y d) se deducen al momento de la definición de polinomio 
característico. 

Del teorema 6.6 resulta que toda relación algebraica que incluya sumas, pro- 
ductos y productos por escalares de los polinomios p A y p B son también válidos 
para los operadores A y B. En particular, si el polinomio característico p A puede 
factorizarse como producto de dos o más polinomios, cada factor debe ser el polino- 
mio característico de un cierto operador con coeficientes constantes, así que según 
el teorema 6.6 existe una correspondiente factorización del operador A. Por ejem- 
plo, si p A (r) = p B (r)p c (r), entonces A = BC. Si p A (r) puede factorizarse como 
producto de n factores lineales, por ejemplo sea 

(6.13) P A (r) = a 0 (r - r,)(r - r 2 ) • • • (r - r„). 

la correspondiente factorización de A toma la forma 

A = a 0 (D - ri )(D - r*) • • • (D - r„). 

E1 teorema fundamental del álgebra nos dice que todo polinomio p A (r) de 
grado n - 1 tiene una factorización de la forma (6.13), donde r x ,r t ,... ,r„ son 
las raíces de la ecuación 


P A (r) = 0, 

llamada ecuación característica de A. Cada raíz se escribe tantas veces como indica 
su orden de multiplicidad. Las raíces pueden ser reales o complejas. Puesto que 
p A (r) tiene coeficientes reales, las raíces complejas se presentan en pares de con- 
jugadas, a + //?, « — ifì, si P 0. Los dos factores lineales correspondientes a 
cada uno de tales pares puede combinarse para dar un factor cuadrático 
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r 2 — 2ar + a 2 + /? 2 cuyos coeficientes son reales. Por consiguiente, todo polino- 
mio p A (r) puede factorizarse como un producto de polinomios lineales y cuadrá- 
ticos con coeficientes reales. Esto nos proporciona una correspondiente factoriza- 
ción del operador A como un producto de operadores de primer y segundo orden 
con coeficientes constantes y reales. 

ejemplo 1. Sea A — D 2 — 5D + 6. Puesto que el polinomio característico 
p A (r) tiene la factorización r 2 — 5r + 6 = (r — 2)(r — 3), el operador + tiene 
la factorización 


D 2 - 5D + 6 = (D - 2)(D - 3). 

ejemplo 2. Sea A = D* — 2D 3 + 2 D 2 — 2D + 1. E1 polinomio caracte- 
rístico p A (r) tiene la factorización 

r 4 - 2r 3 + 2r* - 2r + 1 = (r - l)(r - l)(r 2 + 1), 

así que A tiene la factorización A = (D — 1 )(D — Í)(D 2 +1). 

6.8 Determinación de una base de soluciones para ecuaciones lineales con coe- 
ficientes constantes por factorización de operadores 

E1 teorema que sigue demuestra como la factorización de operadores con 
coeficientes constantes nos ayuda en la resolución de ecuaciones diferenciales linea- 
les con coeficientes constantes. 

teorema 6.7. Sea L un operador con coeficientes cùnstantes que puede fac- 
torizarse como un producto de operadores con coeficientes constantes, por ejemplo 

L = A k A 2 ' • • A k . 

Entonces el espacio solución de la ecuación diferencial lineal L(y) = 0 contiene 
el espacio solución de cada una de las ecuaciones dìferenciáles At(y) = 0. Dicho 
de otro modo, 

(6.14) N(A t ) ç N(L) para cada /=1,2. k. 

Demostración. Si u es el núcleo del último factor Ak tenemos Ak(u)= 0, 
así que 


L(u) = (A,A 2 • ■ • A k )(u) = (+!••• A k _MM = (A k ■ • ■ ^JÍO) = 0. 
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Por lo tanto, el núcleo de L contiene el núcleo del último factor Ak. Pero ya que 
los operadores con coeficientes constantes son permutables, podemos reordenar 
los factores de modo que uno cualquiera de ellos sea el último factor. Esto de- 
muestra (6.14). 

Si L(u) = 0, se dice que el operador L anula u. E1 teorema 6.7 nos dice que 
si un factor Ai de L anula u, también L anula u. 

Vamos a ver cómo puede utilizarse el teorema para resolver las ecuaciones 
diferenciales homogéneas con coeficientes constantes. Hemos elegido ejemplos 
para ilustrar distintos aspectos, que dependen de la naturaleza de las raíces de 
la ecuación característica. 

CASO I.. Raíces reales distintas. 

ejemplo 1. Hallar una base de soluciones para la ecuación diferencial 
(6.15) (Z> 3 — 1D + €)y = 0. 

Solución. Tiene la forma L(y) = 0 con 

L = D 3 - 1D + 6 = (D - 1 )(D - 2 )(D + 3). 

E1 núcleo de D — 1 contiene u t (x) = e*, el de D — 2 contiene u 2 (x) = e 2x , y 
el de D + 3 contiene u 3 (x) = e~ ax . En el capítulo 1 (p. 12) se demostró que 
u lt « 2 , u 3 son independientes. Puesto que tres soluciones independientes de una 
ecuación de tercer orden forman una base para el espacio solución, la solución 
general de (6.15) viene dada por 

y = Cl e* + + Ctf - 3 *. 

E1 método utilizado para resolver el ejemplo 1 nos permite encontrar una 
base para el espacio solución de cualquier operador con coeficientes constantes 
que'pueda descomponerse en producto de factores lineales distintos. 

teorema 6.8. Sea L un operador con coeficientes constantes cuya ecuación 
característica p L (r) = 0 tiene n raices reales distintas r lt r 2i ..., r„. Entonces la 
solución general de la ecuación diferencial L(y) = 0 en el intervalo (— °°, + °°) 
viene dada por la fórmula 


(6.16) 


y ='É C 1 te r **- 
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Demostración. Tenemos la factorización 

L = a 0 (D — r\){D — rg) • • • (D — r„). 

Puesto que el núcleo de (D — n) contiene Uk(x) = e’V', el núcleo de L contiene 
las n funciones 


u^(x) = e TiX , m 2 (x) = e TlX ,, u n (x) = e TnX . 


En el capítulo 1 (p. 12) se demostró que esas funciones son independientes. Por 
consiguiente constituyen una base para el espacio solución de la ecuación L(y)=0, 
así que la solución general viene dada por (6.16). 

CASO II. Raíces reales múltiples. 

Si todas las raíces son reales pero no distintas, las funciones (6.17) no son 
independientes y por tanto no forman una base para el espacio solución. Si una 
raíz r se presenta con multiplicidad m, entonces (D — r) m es un factor de L. 
E1 teorema que sigue nos dice cómo obtener m soluciones independientes en el 
núcleo de ese factor. 

teorema 6.9. Las m funciones 
(6.17) Uk(x) = e TX , u 2 (x) = xe TX ,... , u m (x) = rt™ 

son m elementos independientes anulados por el operador (D — r) m . 

Demostración. La independencia de esas funciones se deduce de la inde- 
pendencia de los polinomios 1, x, x~,..., x m— \ Para demostrar que u lt u 2 ,... ,u m 
son anuladas por (D — r) m lo haremos por inducción. 

St m = 1 existe tan sólo una función, u t (x) = e TX , que evidentemente es 
anulada por (D — r). Supongamos entonces, que el teorema es cierto para m — 1. 
Esto significa que las funciones u 1 ,...,u m - 1 son anuladas por (D — r)" -1 . 
Puesto que 


(D - r) m = (D — r)(D - r)”- 1 


las funciones u t ,..., u m - x también son anuladas por (D — r) m . Para completar 
la demostración tenemos que demostrar que (D — r) m anula u m . Consideremos 
por tanto 
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(D - r) m u m = (D- r) m ~\D - r)(x— 

Tenemos 

(D — r)(x m ~ 1 e rx ) = Z)(x m - 1 e r *) — rx m ~ 1 é rx 

= (m- l)x m ~ 2 e rx + x m ~ 1 ré rx - rx^e™ 

= (m- l)x m ~*e rx = (m- l^u^x). 

Cuando aplicamos (D — r)" 1-1 a los dos miembros de esta última ecuación obte- 
nemos 0 en el segundo miembro ya que (D — r) m_1 anula a u m - t . Luego 
(D — r) m u m = 0 con lo cual u m es anulada por (D — r) m . Esto completa la de- 
mostración. 

ejemplo 2. Hallar la solución general de la ecuación diferencial L(y) = 0, 
donde L = D 3 - D 2 - 8D + 12. 

Solución. E1 operador L tiene la factorización 

L = (D — 2)*(D + 3). 

Según el teorema 6.9, las dos funciones 

u t (x) = e 2 *, u 2 (x) = jce 2 * 

pertenecen al núcleo de (D — 2) 2 . La función u s (x) = er* x pertenece al núcleo de 
(D + 3). Como quiera que u t , u 2 , u 3 son independientes (ver ejercicio 17 de la 
sección 6.9) forman una base para el núcleo de L, así que la solución general 
de la ecuación diferencial es 

y = c^ + CiXe** + c 3 e ~ 3x . 

E1 teorema 6.9 nos indica cómo hallar una base de soluciones para cualquier 
ecuación lineal de orden n con coefìcientes constantes cuya ecuación característica 
tenga sólo raíces reales, alguna de las cuales se repita. Si las raíces distintas son 
t ì, r 2 , ... ,rk y se presentan con las multiplicidades respectivas m t , m 2 , ..., mk, 
la parte de la base que corresponde a r p viene dada por las m p funciones 

u a v (x) = x«- 1 e r » x , donde q = 1,2,... , m p . 

Cuando p toma los valores 1,2,... ,k obtenemos en total m t + ... + m* fun- 
ciones. En el ejercicio 17 de la sección 6.9 esbozamos una demostración haciendo 
ver que todas esas funciones son independientes. Puesto que la suma de las mul- 
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tiplicidades + ... + m* es igual a n, el orden de la ecuación, las funciones 
u p , q forman una base para el espacio solución de la ecuación. 

ejemplo 3. Resolver Ja ecuación (D 6 + 2D 5 — 2D 3 — D 2 )y = 0. 

Solución. Tenemos D 6 +2D 5 -2D 3 -D 2 =D 2 (D-1)(D + 1) 3 . La parte de 
la base correspondiente al factor D 2 es Uj(x) = 1, u 2 (jí) = jc; la parte correspon- 
diente al factor (D — 1) es u 3 (x) = e*; y la correspondiente al factor (D + l) 3 es 
u 4 (x) = e~ x , u s (x) = xe~ x , u e (x) = Las seis funciones u t , .,., u 6 son in- 
dependientes, así que la solución general de la ecuación es 

y = Cj, + c 2 x + c 3 e* + (c 4 + c 6 x + c 6 x 2 )e“*. 

CASO III. Raíces çomplejas. 

Si se emplean exponenciales complejas, no hay necesidad de distinguir entre 
raíces reales y complejas de la ecuación característica de la ecuación diferencial 
L(y) = 0. Si se desean soluciones de valor real, factorizamos el operador L en 
factores lineales y cuadráticos con coefìcientes reales. Cada par de raíces com- 
plejas conjugadas a + i/3, a — i/3 corresponde al factor cuadrático, 

(6.18) D 2 - 2aD + a 2 + j8 2 . 

E1 núcleo de este operador de segundo orden contiene las dos funciones indepen- 
dientes u(x) = e ax cos /?x y v(x) = e? x sen /?x. Si el par de raíces « ± i/3 se pre- 
senta con multiplicidad m, el factor cuadrático se presenta elevado a la potencia 
m-ésima. E1 núcleo del operador 

[D* - 2aD + a 2 + /3 2 ] m 

contiene 2m funciones independientes, 

u q (x) = x'-^e** cos f3x, v q (x) = x Q - 1 e JX sen/3x, q = 1,2, ... , m. 

Esto puede probarse fácilmente por inducción respecto a m. (En el ejercicio 20 
de la sección 6.9 se da un esquema de las demostraciones.) Los ejemplos siguien- 
tes ilustran algunas de las posibilidades. 

ejemplo 4. /" — 4y" + 13/ = 0. La ecuación característica, r 3 — 4r^ + 
+ 13r = 0, tiene las raíces 0, 2 ± 3i; la solución general es 


y = c x + e^Ci cos 3x + c 3 sen3x). 
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ejemplo 5. /" — 2ý' + 4/ — 8y = 0. La ecuación característica es 


r 3 - 2r 2 + 4r - 8 = (r - 2)(r 2 + 4) = 0 ; 
sus raíces son 2, 2/, — 2i, así que la solución general de la ecuación diferencial es 

y = Cie 2 * + c 2 cos 2x + c 3 sen 2jc . 

ejemplo 6. y (5) — 9y (4) + 34/" — 66/' + 65/ — 25y = 0. La ecuación 
característica puede escribirse así 

(r - l)(r 2 - 4r + 5) 2 = 0 ; 

sus raíces son 1, 2 ± /, 2 ± i, por lo que la solución general de la ecuación dife- 
rencial es 


y = Cl e + + c 3 x) cos x + (c 4 + c„x)senx]. 


6.9 Ejercicios 

Hallar la solución general de cada una de 
1 al 12. 

1. ý" - 2/ - 3/ = 0. 

2 . /'-/ = 0 . 

3. /' + 4/ +4/ =0. 

4. /' - 3/ + 3/ -y = 0. 

5. / 4> + 4/" + 6/ + 4/ + y = 0. 

6. / 4) — 16y = 0. 


las ecuaciones diferenciales de los ejercicios 


7. y uì + 16y = 0. 

8- /" -y =°. 

9. y (4) + 4/" + 8 y" + 8/ + 4y = 0. 

10. / 4) +2y' +y =0. 

11. / 6) + 4/ 4) + 4/ = 0. 

12. /*> + 8/ 4) + 16/ = 0. 


13. Si m es una constante positiva, hallar la solución particular y = ](x) de la ecuación di- 
ferencial 


ý" — my" + ttfiý — tt?y = 0 


que satisfaga las condiciones /(0) = /'(0) = 0, /"(0) = 1. 

14. Una ecuación diferencial lineal con coeficientes constantes tiene la ecuación caracterís- 
tica /(r) = 0. Si todas las raíces de la ecuación característica son negativas, demostrar 
que toda solución de la ecuación diferencial tiende a cero cuando x —> +oo. ^Qué se 
puede asegurar acerca del comportamiento de todas las soluciones en el intervalo 
[0, +oo) si todas las raíces de Ia ecuación característica son no positivas? 
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1 coefìcientes constantes que s 


15. En cada caso, hallar una ecuación diferencial lineal c 
satisfaga para todas las funciones dadas, 

a) u ± (x) = e x , U./X) = e~ x , u 3 (x) = e 2x , u 4 (x) = e - 2x . 

b) u t (x) = e~ 2x , u 2 (x) = xe- 2x , u 3 (x) = x 2 e 2x . 

c) u 4 (x) = 1, u 2 (x) = x, u 3 (x) = e x , u 4 (x) = xe x . 

d) u 3 (x) = x, u 2 (x) = e x , u 3 (x) = xe x . 

e) u 4 (x) = x 2 , u 2 (x)=e x , u 3 (x) = xe* . 

f) u L (x) = e - 2x cos 3x, u 2 (x) = sen 3x, u 3 (x) = e-‘ 2x , u 4 (x) = xe- 2x . 

g) u 3 (x) = cosh x, u 2 (x) = scnh x , u 3 (x) = x cosh x, u A (x) = x senh *. 

h) u 3 (x) = cosh x sen oí , u 2 (x) = senh xcosx, u 3 (x) = x. 

16. Sean ri,...,r„n números reales distintos, y Qi,... ,Q n ,n polinomios, ninguno de los 
cuales es el polinomio nulo. Demostrar que las n funciones 


son independientes. 

Bosquejo de la demostración. Emplear la inducción respecto a n. Para n = 1 y 
n = 2 el resultado es fácilmente comprobable. Supongamos que la proposición es cierta 
para n = p y sean Ci,..., c, +í , p + 1 escalares reales tales que 


2 c kQk(x)e r * x = 0. 

Multipliquemos los dos miembros por e~ r »+i x y derivemos la ecuación resultante. Em- 
plear entonces la hipótesis de inducción para probar que todos los escalares c k son 0. 
Puede darse otra demostración basada en el orden de magnitud cuando x -+ + <*> , como 
se hizo en el ejemplo 7 de la sección 1.7 (p. 12). 

17. Sean m u mi,..., m t , k enteros positivos, y n, r î( . .., n, k números reales distintos, y 

sea n = mi +- 1 -m t . Para cada par de enteros p, q que cumplan 1 < p < k, 

1 < q < m„ pongamos 


u„. P (x) = x Q - 1 e r * x . 

Por ejemplo, cuando p = 1 las correspondientes funciones son 

“uW = e TlX , " 2.1 W = xe T i x ,.... « OTiil ( x) = X m i~ 1 e r ' x . 

Demostrar que las n funciones u,, p así definidas son independi^entes. 

[Indicación: Aplicar el ejercicio 16.] 

18. Sea L un operador diferencial lineal de orden n con coeficientes constantes y polinomio 
caracterísfico p(r). Sea L' el operador de coeficientes constantes cuyo polinomio carac- 
terístico es la derivada p’(r). Por ejemplo, si L = 2 D 2 — 3 D.+ 1 entonces L' = 4D — 3. 
Con mayor generalidad, definamos la derivada m-ésima L 1 " 1 como el operador cuyo poli- 
nomio característico. es la derivada m-ésima p ( "’(r). (E1 operador L'”’ no debe confun- 
dirse con la potencia m-ésima L".) 
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a) Si u tiene n derivadas, demostrar que 

b) Si u tiene n — m derivadas, demostrar que 

, (m)í \ ”V / >(t+m> (°) 

L {mì (u) = 2^ --« u) P ara 


donde L m = L . 

19. Con la notación del ejercicio 18. Si u y v tienen n derivadas, demostrar que 




[Indicación: Emplear el ejercicic 18 junto con la fórmula de Leibniz para la 
derivada fc-ésima de un producto: 


(uv)W 


20. a) Sea p(t) = q(t) m r(t), donde q y r son polinomios y m es un entero positivo. Demos- 
trar que p'(f) = q(t) m ~'s(t), donde s es un polinomio. 

b) Sea L un operador con coeficientes constantes que anula u, siendo u una función 
dada de x. Sea M = L m , la potencia m-ésima de L, donde m > 1. Demostrar que cada 
una de las derivadas M', M", .... M' m ~" anulan también u. 

c) Con la parte b) y el ejercicio 19 demostrar que M anula cada una de las funciones 
u,xu,... ,x m "‘u. 

d) Con la parte c) demostrar que el operador (D 1 — 2 aD + a 1 4- /3 2 )" anula cada una 
de las funciones x Q e IX sen /?.v y x Q e* x cos f)x para q = 1,2,..., m — 1. 

21. Sea L un operador de orden n con coeficientes constantes y polinomio característico 
p(r). Si a es constante y u tiene n derivadas, demostrar que 

L(e* x u(x)) = „<*>(*). 

x—t k\ 


6.10 Relación entre las ecuaciones homogéneas y no homogéneas 

Volvamos ahora a la ecuación diferencial lineal general de orden n con coe- 
ficientes que no sean necesariamente constantes. E1 teorema que sigue describe la 
relación entre las soluciones de una ecuación homogénea L(y) = 0 y las de una 
no homogénea L(y) — R(x). 

teorema 6.10. Sea /. ■/é’ n (J) > <W(J) un operador diferencial lineal de orden 
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n. Sean u lt ... ,u n , n soluciones independientes de la ecuación homogênea L(y)=Q, 
y sea y, una solucîón particular de la ecuación no homogénea L(y) = R, donde 
R etf (J). Entonces toda solución y = f(x) de la ecuación no homogénea tiene la 
forma 

(6.19) f(x) = yi (x) + f c k u k (x), 

k=l 

donde c t .... ,c„ son constantes. 

Demostración. Por la linealidad tenemos L(f—y t )=L(f)—L(yi)=R—R=Q. 
Por lo tanto f — y i pertenece al espacio solución de la ecuación homogénea 
L( y) = 0, así que / — yi es una combinación lineal de u lt ... ,u„, es decir, 
/ — yi = c,«i + ... + c„u„. Esto demuestra (6.19). 

Puesto que todas las soluciones de L(y) = R se obtienen con (6.19), la suma 
del segundo miembro de (6.19) (con las constantes arbitrarias c u c 2 ,..., c„) se 
llama la solución general de la ecuación no homogénea. E1 teorema 6.10 establece 
que la solución general de la ecuación no homogénea se obtiene sumando a y^ 
la solución general de la ecuación homogénea. 

Observación: E1 teorema 6.10 tiene una sencilla analogía geométrica que 
nos ayuda a profundizar en su significado. Para determinar todos los puntos de un 
plano encontramos un punto del mismo y le sumamos todos los puntos de un plano 
paralelo que pasa por el origen. Para encontrar todas las soluciones de L(y) = R 
encontramos una solución particular y le sumamos todas las soluciones de la ecua- 
ción homogénea L(y) = 0. E1 conjunto de soluciones de la ecuación no homogénea 
es análogo al plano que pasa por un determinado punto. E1 espacio solución de la 
ecuación homogénea es análogo al plano paralelo que pasa por el origen. 


En la práctica para utilizar el teorema 6.10 tenemos que resolver dos proble- 
mas: 1) Hallar la solución general de la ecuación homogénea L(y) = 0, y 2) hallar 
una solución particular de la ecuación no homogénea L(y) = R. En la próxima 
sección demostramos que siempre se puede resolver el problema 2) si podemos 
resolver el problema 1). 

6.11 Determinación de una solución particular de la ecuación no homogénea. 

Método de variación de constantes 

Volvamos a considerar el problema de la determinación de una solución par- 
ticular y, de la ecuación no homogénea L(y) = R. Expondremos un método lla- 
mado de variación de constantes que nos indica cómo determinar y t si conocemos 
n soluciones independientes u,,... ,u„ de la ecuación homogénea L(y) = 0. 
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E1 método proporciona una solución particular de la forma 

(6.20) Ji = + • • • + v n u n , 

donde v x , . . ., v„ son funciones que pueden calcularse en función de 
y del segundo miembro R. E1 método nos conduce a un sistema de n ecuaciones 
algebraicas lineales que se satisfacen con las derivadas v[,... ,v' n . Este sistema 
siempre puede resolverse debido a que tiene una matriz de coeficientes no sin- 
gular. La integración de las derivadas, da entonces las funciones deseadas 
v, ,... ,v n . E1 primero que utilizó el método fue Juan Bernoulli para resolver 
ecuaciones lineales de primer orden, y luego Lagrange en 1774 para resolver ecua- 
ciones lineales de segundo orden. 

Para el caso de orden n pueden simplificarse los detalles utilizando notación 
vectorial y matricial. E1 segundo miembro de (6.20) puede escribirse como un 
producto interior 

(6.21) Jx = (f,M), 

donde v y u son funciones vectoriales n-dimensionales dadas por 

v = ( y i. V n), « = («!,...,«„). 

Intentamos elegir v de manera que el producto interior que define satisfaga la 
ecuación no homogénea L(y) — R, sabiendo que L(u) = 0, donde L(u) = (L(u^), 
.... L(«„)). 

Comenzamos calculando la primera derivada de y t . Encontramos 

(6.22) y[ = (v, u ') + (v', u). 

Como tenemos n funciones v lt ... ,v„ por determinar, deberemos precisar n 
condiciones que las relacionen. Si imponemos la condición de que el segundo 
término del segundo miembro de (6.22) se deba anular, la fórmula para yí se 
simplifica y queda 


y'i = (v, u’) , con tal que (v', u) = 0. 


Derivando la relación que da y\ encontramos 


y'l = (V, u") + (v', u'). 
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Si podemos elegir v de modo que ( 1 /, u') = 0 entonces la fórmula que da y[ 
también se simplifica y queda 

yï = (v, M"),con tal que también(v', u’) = 0. 

Si seguimos de este modo con las n — 1 primeras derivadas de y r encontramos 


yì” v = ( v , m ( " 1( ), con tal que (v', u (n 2Ì ) = 0 . 

Hasta aquí hemos establecido n — 1 condiciones a v. Derivando una vez más 
llegamos a 


yì n) = (v, M (n) ) + (v', M (n u ). 

Impongamos ahora la condición (v', M (n-1) ) = R(x), y la última ecuación se trans- 
forma en 


y[ n) = (v, M (n) ) + R(x), con tal que(v', M (n 1( ) = R(x). 

Supongamos, por el momento, que se pueden satisfacer las n condiciones impues- 
tas a v. Sea L = D n + P 1 (x)D n ~ 1 + ... + P„(x). Cuando aplicamos L a yi en- 
contramos 


L(yi) = J'í" 1 + Pi(x)y} n 11 + • • • + P n (x)yy 

= {(v, M (n) ) + R(x)} + Pi(x)(v, M (n_1) ) H -+ P„(x)(v, m) 

= (v, L(u)) + R(x) = (v, 0) + R(x) = R(x). 


Es decir, L(y,) = R(x), así que y, es una solución de la ecuación no homogénea. 

E1 método tendrá éxito si se pueden satisfacer las n condiciones que hemos 
impuesto a v. Esas condiciones establecen que (i/, i/ &) ) = 0 para k = 0,1,.. *, 
n — 2, y que (v', u (n-1) )= R(x). Podemos escribir esas n ecuaciones en una sola 
ecuación matricial, 

w 


(6.23) 


W(x)v’(x) = *(x) 


Ò 

1 
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donde v (x) se considera como una matriz columna «X1, y W es la matriz 
nXn cuyas filas están formadas por los componentes de u y sus derivadas su- 
cesivas: 



La matriz W se llama matriz wronskiana de en recuerdo de 

J. M. H. Wronski (1778-1853). 

En la sección que sigue demostraremos que la matriz wronskiana es no 
singular. Por consiguiente, podemos multiplicar ambos miembros de (6.23) por 
W(x) -1 obteniendo 


v'(x) = «(x)fL(x)- 1 , 


Elijamos dos puntos c y x en el intervalo J que se considera, e integremos e 
ecuación vectorial en el intervalo, desde c a x, obteniendo 


v(x) = v(c) + R(t)W(ty 


J> 


dt = v(c) + z(x), 


z(x) = jmivor 1 

La fórmula y, = (u, v) para la solución particular toma ahora el aspecto 


Jl = (u, v) = (u, v(c) + z)= (u, v(c)) + (u, z). 
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E1 primer término (u, v(c)) satisface la ecuación homogénea puesto que es una 
combinación lineal de u lt ...,u„. Por consiguiente podemos omitir este término 
y utilizar el segundo término («, z) como una solución particular de la 'ecuación 
no homogénea. Es decir, una solución particular de L(y) = R viene dada por el 
producto interior 

fol 


(“W> 2(X)) 




R(t)W(t)~ 


Obsérvese que no es necesario que la función R sea continua en el intervalo /. 
Todo lo que se exige es que R sea integrable en [c,x]. 

Podemos resumir los resultados de esta sección mediante el teorema siguiente. 


teorema 6.11. Sean Uí ,... ,u„,n soluciones independientes de la ecuación 
diferencial lineal de orden n homogénea L(y) = 0 en un intervalo J. Entonces 
una solución particular y^ de la ecuación no homogénea L(y) = R viene dada por 
la fórmula 

yÁ*) 


donde v t .... ,v„ son los elementos de la matriz columna v, nX 1, determinada 
por la ecuación 


(6.24) 


v(x)= nomoH 


En esta fórmula, W es la matriz wronskiana de u^,... ,u„, y c es un punto cual- 
quiera de /. 


Observación: La inlegral definida en (6.24) puede reemplazarse por cualquier 
integral indefinida. 


ejemplo 1. Hallar la solución genèral de la ecuación diferencial 
„ 2 
y - 3 » = 7 ——; 

1 + € X 

en el intervalo ( — °°, + 00 ). 
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Solución. La ecuación homogénea, (D 2 — l)y = 0 tiene las dos soluciones 
independientes Wl (x) = e*, u 2 (x) = e~ x . La matriz wronskiana de u :i y w 2 es 



Puesto que det W(x) = — 2, la matriz es no singular y su inversa viene dada por 


Por consiguiente, 



y tenemos 


^(x)lP(x)- 1 


r-e-1 

e * 

1 + e* 

■LJ = 

—e x 


Ll + e x J 


Integrando cada componente del vector del segundo miembro encontramos 

yi(x)= J nrr* dx= j [ e ~ x ~ 1 + nb) dx = - *+ ,o s <i + o 


v ì(x) - f -—— dx = -log (1 + e x ). 
J 1 + e x 


La solución general de la ecuación diferencial es, por consiguiente, 

y = c i w i (*) + c 2 u 2 (x) + yi ( x ) Wl ( x ) + v 2 (x)u 2 (x) 

= c\e x + c 2 e~ x - 1 - xe x + (e* - e~ x ) Iog (1 + é *). 


6.12 No singularidad de la matriz wronskiana de n soluciones independientes de 
una ecuación lineal homogénea 

En esta sección demostramos que la matriz wronskiana W de n soluciones 
independientes u 2 de una ecuación homogénea L(y) = 0 es no singular. 

Lo vamos a hacer demostrando que el determinante de W es una función exponen- 
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cial que nunca se anula en el intervalo / que se considera. 

Sea w(x) = det W(x) para cada x de /, y supongamos que la ecuación dife- 
rencial que se satisface con las funciones u x ,... ,Un tiene la forma 

(6.25) / n> + P^x)/"-" + • • • + P n (x)y = 0. 

Tenemos entonces: 

teorema 6.12. El determinante wronskiano satisface la ecuación diferencial 
de primer orden 

(6.26) w' + P,(x)w = 0 
en J. Por consiguiente, si c e J tenemos 

(6.27) w(x) = w(c) exp £ P t (t) díj (Fórmula de Abel). 

Además, w(x) # 0 para todo x de }. 

Demostración. Sea u el vector fila u = (u x ,..., u„). Ya que cada compo- 
nente de u satisface la ecuación diferencial (6.25) lo mismo ocurre para u. Las 
filas de la matriz wronskiana W son los vectores u, u', m‘ m-1> . Luego podemos 

escribir 


w = det W = det (u, u',..., w (M ” 1) ). 


La derivada de w es el determinante de la matriz obtenida derivando la última fila 
de W (ver ejercicio 8 de la sección 3.17). Esto es 

w' = det (u, u',..., u in ~ i} , u (n> ). 

Multiplicando la última fila de w por P,(x) también tenemos 

/’ 1 (a)h' = det (u, u',..., u (n ~ 2) , / , 1 (jc)M ,n - 1) ). 

Sumando esas dos últimas ecuaciones encontramos 

w' + Px(x)w — det (u, w <n - 2) , w (M) + / > 1 (x)m ( ”- 1) ) . 

Pero las filas de este último determinante son dependientes puesto que u satisface 
la ecuación diferencial (6.25). Por tanto el determinante es cero, lo que signifìca 
que w satisface (6.26). Resolviendo (6.26) obtenemos la fórmula de Abel (6.27). 
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Seguidamente demostramos que w{c) ¥= 0 para un cierto c de /. Lo hacemos 
por reducción al absurdo. Supongamos que w(t) = 0 para todo t de /. Elijamos 
un t fìjo en /, por ejemplo t = t 0 , y consideremos el sistema lineal de ecuaciones 
algebraicas 


W(t 0 )X=O, 

donde X es un vector columna. Ya que det W(t 0 ) = 0, la matriz W(t 0 ) es singular 
por lo que ese sistema admite una solución no nula, sea ésta X = (c x ,... ,c„) ¥= 
(0,..., 0). Utilizando los componentes de este vector no nulo, sea / la combi- 
nación lineal 


f(t) = CjU^t) + • • • + c n u n (t). 

La función / así definida satisface L(f) = 0 en / puesto que es una combinación 
lineal de u x ,... ,u n . La ecuación matricial W(t 0 )X = O implica que 

m=f'(t 0 ) -=/(»-D( í# ) = o. 

Por consiguiente, / tiene como valor inicial el vector O en t = t 0 , así que, según el 
teorema de unicidad, / es la solución cero. Esto significa Cj = ... = c„ = 0, lo 
lo cual es una contradicción. Por lo tanto w(t) # 0 para un cierto t en /. Tomando 
ese valor de t como c en la fórmula de Abel vemos que w(x) ¥ 0 para todo x 
de /. Esto completa la demostración del teorema 6.12. 

6.13 Métodos especiales para determinar una solución particular de la ecuación 
no homogénea. Reducción a un sistema de ecuaciones lineales de primer 
orden 

Si bien el método de variación de constantes proporciona un método general 
para determinar una solución particular de L(y) = R, existen métodos especiales 
que a menudo son de aplicación más sencilla cuando la ecuación tiene ciertas 
formas especiales. Por ejemplo, si la ecuación tiene coeficientes constantes pode- 
mos reducir el problema al de resolver una sucesión de ecuaciones lineales de 
primer orden. E1 método general queda mejor ilustrado con un ejemplo sencillo. 

ejemplo 1. Hallar una solución particular de la ecuación 
(6.28) (D - 1 )(D - 2)y = xé*^. 

Solución. Pongamos u = (D — 2)y. Entonces la ecuación se transforma en 
(D - 1)« = xé^. 
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Ésta es una ecuación lineal de primer orden en u que puede resolverse con el 
teorema 6.1. Una solución particular es 

u = £e x+ *\ 

Sustituyéndola en la ecuación « = (£) — 2)y obtenemos 
(D - 2)y = \?+ x \ 

que es una ecuación de primer orden en y. Resolviéndola con el teorema 6.1 en- 
contramos que una solución particular (con yi(0) = 0) viene dada por 

yAx) = \e 2x $*<?*'* dt. 

Aunque la integral no puede calcularse por medio de funciones elementales, con- 
sideramos la ecuación como resuelta, puesto que la solución se expresa por medio 
de integrales de funciones corrientes. La solución general de (6.28) es 

y = c x e x + c 2 e 2x + \e 2x f* e‘ 2 ~‘dt. 

6.14 Método del anulador para determinar una solución particular de la ecuación 
no homogénea 

Describimos a continuación un método que se puede utilizar si la ecuación 
L(y) = R tiene coeficientes constantes y si el segundo miembro R es anulado por 
un operador de coeficientes constantes, a saber A(R) = 0. En principio, el mé- 
todo es muy sencillo. Aplicamos el operador A a los dos miembros de la ecuación 
diferencial L(y) = R y obtenemos una nueva ecuación AL(y) = 0 que debe ser 
satisfecha por todas las soluciones de la ecuación original. Puesto que Al es otro 
operador con coeficientes constantes podemos determinar su núcleo calculando 
las raíces de la ecuación característica de AL. E1 problema se reduce entonces a 
determinar, a partir de ese núcleo, una función particular yi que satisface 
L(y i) = R. Veamos algunos ejemplos. 

ejemplo 1. Hallar una solución particular de la ecuación 
( D 4 - 16)y = x 4 + x + 1. 

Solución. E1 segundo miembro, un polinomio de cuarto grado, es anulado 
por el operador D 5 . Por tanto, cualquier solución de la ecuación dada también lo 
es de la ecuación 

(6.29) 


D 6 (D* - 16)y = 0. 
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Las raíces de la ecuación característica son 0, 0, 0, 0, 0, 2, —2, 2 i, —2i, con lo 
que todas las soluciones de (6.29) se encuentran en la combinación lineal 

y = Ci + C 2 x + c 3 x 2 + CiX 3 + c 5 x 4 + c 6 e 2x + c,e~ 2x + c 8 cos 2x + c 9 sen2x. 


Deseamos elegir las c; de modo que L(y) = x 4 + x + 1, donde L = D* — 16. 
Puesto que los cuatro últimos términos son anulados por L, podemos tomar 
c e = c 7 = c s = c„ = 0 e intentamos encontrar c t ,,c s de modo que 

L(Ci + c 2 x + c 3 x 2 + c 4 x 3 + c 5 x 4 ) = x 4 + x + 1 . 

Es decir, buscamos una solución particular que sea un polinomio de cuarto 
grado que satisfaga L(y 7 ) = x* + x + 1. Para simplificar escribamos 

1 ójj = ax 4 + bx 3 + cx 2 + dx + e. 

Esto nos da 16y' 4 ' = 24a, así que JÌ 4) = 3a/2. Sustituyendo en la ecuación dife- 
rencial L(y 7 ) = x 4 + x + 1, tenemos que determinar a, b, c, d, e que satisfagan 

|a — ax 4 — bx 3 — cx 2 — dx — e = x 4 + x + 1 . 

Igualando los coeficientes de las potencias semejantes de x obtenemos 
a = — 1 , b = c = 0 , d=— 1 , e = — f, 

de manera que la solución particular yi viene dada por 

yi = ìe-X 4 ïVx 3 %. 

ejemplo 2. Resolver la ecuación diferencial y" — 5y' + 6 y = xe*. 
Solución. La ecuación diferencial tiene la forma 
( 6 - 3 °) L(y) = R, 

donde R(x) = xe x y L = D 2 — 5 D + 6 . La correspondiente ecuación homogénea 
puede ponerse en la forma 


(D - 2)(D - 3)j = 0 ; 


que tiene las soluciones independientes u,(x) = e 2x , u 2 (x) = e 3x . 
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Buscamos ahora una solución particular de la ecuación no homogénea. 
Comprobamos que la función R(x) = xe 1 es una solución de la ecuación homo- 
génea 


(D-iyy = 0. 

Por consiguiente, si aplicamos a los dos miembros de (6.30) el operador (D — l) 2 
encontramos que cualquier función que satisfaga (6.30) debe también satisfacer 
la ecuación 


(D - 1 f(D - 2)(D - 3)j = 0. 

Esta ecuación diferencial tiene las raíces características 1, 1, 2, 3, por lo que todas 
sus soluciones se encuentran en la combinación lineal 

y = ae? + bxe* + ce 2 * + dé^, 

donde a, b, c, d son constantes. Queremos elegir a, b, c, d, de modo que la so- 
lución >>! resultante satisfaga L(y,) = xe x . Puesto que L(ce 2x + de 3x ) = 0 cuales- 
quiera que sean los c y d, sólo necesitamos elegir a y b de manera que. 
L(ae* + bxe 1 ) = xe* y tomamos c = d = 0. Si ponemos 

= oe* + bxé*, 

tenemos 

D(yò = (a + b)e* + bxé*, D 2 ( yi ) = (a + 2b)e x + bxé*, 
así que la ecuación (D 2 — 5D + 6)y t = xe x se convierte en 


(2 a - 'ìb)é c + 2bxe* = xe*. 

Suprimiendo el factor e x e igualando los coefìcientes de las potencias semejantes 
de x encontramos a = f, b = \. . Por lo tanto, y, = fe' + jxe* y la solución 
general de L(y) = R viene dada por la fórmula 

y = + c 2 e 3x + fe* + jxe*. 

E1 método utilizado en los ejemplos anteriores se llama método del anulador. 
Se podrá emplear si podemos encontrar un operador de coefìcientes constantes A 
que anule R. A partir de nuestro estudio de las ecuaciones diferenciales lineales 
homogéneas con coeficientes constantes, sabemos que las únicas funciones de valo- 
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res reales anuladas por operadores con coeficientes constantes son combinaciones 
lineales de funciones de la forma 

x m ~ 1 e ax , x m ~ 1 e' tx cos p x; x m- 1^«* sen p x , 

donde m es un entero positivo y a y /8 son constantes reales. La función 
y = x m ~'e" x es una solución de una ecuación diferencial con raíz característica a 
de multiplicidad m. Por lo tanto, esta función tiene el anulador ( D — a) m . Cada 
una de las funciones y = x m ~'e ax cos fix e y = x m ~'e" x sen /3x es una solución de 
una ecuación diferencial con raíces características complejas a ± ifi, con multi- 
plicidad m cada una, de modo que son anuladas por el operador [D 2 3 4 5 — 2aD -f 
+ (a 2 + /3 2 )] m . Para facilitar la resolución de algunos ejercicios, damos una 
lista de esos anuladores en la tabla 6.1, junto con alguno de sus casos particulares. 


Tabla 6.1 


Función 

Anuladov 


y = x” 1 - 1 

D m 



D-ol 


y = X m ~ 1 e ax 

(D - «) m 


y = cos /Sx o y = sen /?x 

D 2 + /g2 


y = x m_1 cos (3x o y = x™- 1 sen fix 

(d* + 


y = e xx cos /9x o + = e* x sen/3x 

D 2 - 2<xD + (« 2 

+ P 2 ) 

y = x m ~ 1 e xx cos /?x o y = x m ~ 1 e !ix sen fix 

[D 2 - 2 «D + (« 2 

+ /? 2 )] m 


Aunque el método del anulador es muy eficaz cuando se puede aplicar, se 
limita a las ecuaciones cuyos segundos miembros R tienen un anulador con coe- 
ficientes constantes. Si R(x) tiene la forma e x *, log x, o tan x, el método no se 
podrá aplicar; tenemos entonces que utilizar la variación de constantes o algún 
otro método para encontrar una solución particular. 

6.15 Ejercicios 

En cada uno de los ejercicios 1 al 10, hallar la solución general en el intervalo 

(-=o,+ o=). 


1 . / -/ = * 2 . 

2. / -4 y = e 2x . 

3. / + 2 y = 3xe x . 

4. y“ +4 y = sen x. 

5. y” - 2/ + y =e x + e 2x . 


7. /' -/ =e *+e~ x . 

8. y" + 3/ + 3/ + y = xe~ x . 

9. / + y = xe x sen 2x. 

10. / 4) — y = x 2 e~ x . 
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11. Si un operador con coeficientes constantcs A anula / y si un operador con coeficientes 
constantes B anula g, demostrar que el producto AB anula / + g. 

12. Sea A un operador con coeficientes constantes con polinomio característico p A . 

a) Aplicar el método del anulador para demostrar que la ecuación diferencial 
A(y) = e* x tienc un'a solución particular de la forma 

_ e« x 

si a no es un cero del polinomio p A . 

b) Si a es un cero simple de p A (multiplicidad 1), demostrar que la ecuación A (y) = e xx 
tiene la solución particular 


xe* x 

y '~7m 

c) Generalizar los resultados de a) y b) cuando a es un cero de p A con multiplicidad m. 

13. Dados dos operadores con coeficientes constantes A y B cuyos polinomios característicos 
no tienen ceros comunes. Sea C = AB. 

a) Demostrar que toda solución de la ecuación diferencial C(y) = 0 tiene la forma 
y = yi + yi, donde A(yO = 0 y B( y 2 ) = 0. 

b) Demostrar que las funciones yi e y 2 de la parte a) están determinadas con unicidad. 
Esto es, para una y dada que satisfaga C(y) = 0 cxiste sólo un par y t , y 2 con las pro- 
piedades de la parte a). 

14. Si L( y) = y" + ay' + by, donde a y b son constantes, sea / la solución particular de 
L(y) = 0 que satisface las condiciones /(0) = 0 y /’(0) = 1. Demostrar que una solución 
particular de- L(y) = R viene dada por la fórmula 


yi (x) = j*f(x - t)R(t) dt 


para cualquier c. En particular, si las raíces de la ecuación característica son iguales, 
por ejemplo r, = r 2 = m, demostrar que la fórmula que da yi(x) se convierte en 


y t (x) = e mx j*(x - t)e~ mt R(t)dt. 

15. Sea Q el operador «multiplicación por x». Esto es, Q(y)(x) = x y(x) para cada y de la 
clase y cada x real. Designemos con / el operador identidad, definido por I(y) = y 
para cada y àe. ( € TO . 

a) Demostrar que DQ — QD = I. 

b) Demostrar que D 2 Q — QD 1 es un operador de primer orden con coeficientes cons- 
tantes, y determipar tal operador explícitamente como un polinomio de primer grado 
en D. 

c) Demostrar que D S Q — QD 3 es un operador de segundo orden con coeficientes cons- 
tantes, y determinar dicho operador explícitamente como un polinomio de segundo 
grado en D. 

d) Enunciar la generalización sugerida por el operador D’Q — QD', y demostrarla por 
inducción. 
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En cada uno de los ejercicios del 16 al 20, hallar una solución general de la ecuación dife- 
rencial en el intervalo que se indica. 

16. ý - y = 1/x, (0, +oo). 

17. y" + 4y = sec 2x, 

18. /-y =sec 3 x -secar, | - ^ , ^) . 

19. / -2/ +y =e'V - 1)®, (-oo, +oo). 

20. y'" - ly“ + 14/ - 8+ = logAf, (0, +oo). 

6.16 Ejercicios varios sobre ecuaciones diferenciales lineales 


1. Una curva integral y = u(x) de la ecuación diferencial y" — 3y' — 4y = 0 corta a una 
curva integral y = v(x) de la ecuación diferencial y" + 4y' — 5y = 0 en el origen. De- 
terminar las funciones u y v si las dos curvas tienen la misma pendiente en el origen 
y si 


IX *)] 4 

, u(x) 6 


2. Una curva integral y = u(x) de la ecuación diferencial y" — 4y' + 29y = 0 corta a una 
curva integral y = v(x) de la ecuación diferencial y" + 4y' + 13y = 0 en el origen. Las 
dos curvas tienen la misma pendiente en el origen. Determinar u y v si m'(tt/2) = 1. 

3. Sabiendo que la ecuación diferencial y" + Axy' + Q(x) y = 0 tiene dos soluciones de la 
forma yi = u(x) e y 2 = xu(x), donde m(0) = 1, determinar u(x) y Q(x) explícitamente 
en función de x. 

4. Sea L( y) = y" + P,y'+ P 2 y. Para resolver la ecuación no homogénea L( y) = R por el 
método de variación de constantes, necesitamos conocer dos soluciones linealmente inde- 
pendientes de la ecuación homogénea. Este ejercicio demuestra que si se conoce una 
solución Mi de L(y) = 0, y si u, no se anula en un intervalo /, una segunda solución m 2 
de la ecuación homogénea viene dada por la fórmula 

u.(x, -,,(») 

donde Q(x) = e íi\ix)dx^ y c e s un punto cualquiera de /. Estas dos soluciones son 
independientes en /. 

a) Demostrar que la función m 2 satisface L(y) = 0. 

b) Demostrar que u, y u 2 son independientes en J. 

5. Hallar la solución general de la ecuación 


xy" - 2(x + 1)+' + (x + 2)y = xV* 
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para x > 0, sabiendo que la ecuación homogénea tiene una solución de la forma y=e ml . 

6. Obtener a simple inspección una solución no nula y luego encontrar la solución general 
de la ecuación diferencial 


(y' ~ 4/) + x 2 (y' - 4y) = 0. 

7. Hallar la solución general de la ecuación diferencial 

4x 2 y" + 4xy' — y = 0, 

sabiendo que existe una solución particular de la forma y = x m para x > 0. 

8. Hallar una solución de la ecuación homogénea por tanteo, y encontrar luego la solución 
general de la ecuación 


x(l - x)y" - (1 - 2x)y' + (** - 3x + l)y = (1 - xf. 

9. Hallar la solución general de la ecuación 

(2x - 3 x?)y" + 4/ + 6 xy = 0, 


sabiendo que tiene una solución que es un polinomio en x. 

10. Hallar la solución general de la ecuación 


x 2 (l - x)y" + 2x(2 - x)y' + 2(1 + x)y = x 2 , 

sabiendo que la ecuación homogénea tiene una solución de la forma y = x c . 

11. Sea g(x) = J* e’/tdt si x > 0. (No intentar el cálculo de esta integral.) Hallar todos los 
valores de la constante a tales que la función / definida por 

f(x) = ~ e al/lx ' 1 


satisfaga la ecuación diferencial lineal 

x 2 y" + (3x - x 2 )y’ + (1 - jc - e 2x )y = 0. 

Sabiendo esto determinar la solución general de Ia ecuación en el intervalo (0,+<*>). 


6.17 Ecuaciones lineales de segundo orden con coeficientes analíticos 

Se dice que una función f es analítica en un intervalo (x 0 — r, x 0 + r) si f 
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tiene un desarrollo en serie de potencias en ese intervalo. 


f(x) = J a n (x - x 0 ) n . 


convergente para |x — jc 0 | < r. Si los coeficientes de una ecuación diferencial 
lineal homogénea 


y in> + Ptix)/”-» + • • • + P n (x)y = 0 

son analíticos en un intervalo (x 0 — r, x 0 + r), puede entonces demostrarse que 
existen n soluciones independientes u t ,... ,u«, cada una de las cuales es analítica 
en el mismo intervalo. Demostraremos este teorema para ecuaciones de segundo 
orden y luego discutiremos un importante ejemplo que se presenta en muchas 
aplicaciones. 

teorema 6.13. Sean y P 3 analîticas en un intervalo abierto (x 0 — r, 
x 0 + r), tales como 

p i(x) = 2h(x - x 0 ) n , P 2 (x) = fc n (x - x 0 ) n . 


Entonces la ecuación diferencial 

(6.31) y" + Pi(x)y' + P 0 (x)y = 0 

tiene dos soluciones independientes y u? que son analíticas en el mismo in- 
tervalo. 

Demostración. Intentemos encontrar una serie de potencias solución de la 
forma 

(6-32) y = 2a n (x-x 0 ) n . 


convergente en el intervalo dado. Para ello, sustituimos las series dadas para 
Pi y P 2 en la ecuación diferencial y determinamos luego las relaciones que los 
coeficientes On deben satisfacer para que la función y dada por (6.32) satisfaga 
la ecuación. 

Las derivadas / e /' pueden obtenerse derivando la serie de potencias de 
y término a término (ver teorema 11.9 del Volumen I). Esto nos da 
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y' “ *o)” _1 =J> + l)a n+1 (x - x 0 )\ 

y" = í 2 "(« - 1 )a„(x - x 0 ) n - 2 = § (n + 2)(n + 1 )a n+ì (x - x 0 ) n . 

Los productos ?,(*)/ y P 2 (x)y vienen dados por las series de potencias (*) 

Pi(x)y' = J+ l ) a k+iK-^(x - x 0 ) n 

y 

Pi(x)y = 2 o (îa k c n _^(x - x 0 ) n . 

Cuando esas series se sustituyen en la ecuación diferencial (6.31) encontramos 

Z o {(" + 2)(« + l)«n+2 +2 # (( fc + 1 )«*+l&n-* + a lc C„_ k ] j(x — X 0 )” = 0. 

Por consiguiente, la ecuación diferencial se satisfará si elegimos los coeficientes 
a„ de modo que satisfagan las fórmulas recurrentes 

(6.33) (n + 2 )(n + 1 )a n+ì = - 2 P + ^it+ihn-* + a k c n _ k ] 

Para n = 0,1,2, .... Esta fórmula expresa a„ +2 en función de los coeficientes 
anteriores a 0 , a u . .., «„ +1 y los coeficientes de las funciones dadas y P 2 . Elija- 
mos valores arbitrarios de los dos primeros coeficientes a 0 y «i y utilicemos la 
fórmula recurrente para definir los restantes coeficientes a 2 , a 3 ,..., en función de 
«o y fli. Esto garantiza que la serie de potencias (6.32) satisfará la ecuación di- 
ferencial (6.31). E1 siguiente paso de la demostración es probar que la serie así 
definida converge realmente para todo x del intervalo (x 0 — r,x 0 + r). Esto se 
hace mayorando la serie (6.32) por otra serie de potencias convergente. Finalmen- 
te, demostramos que podemos elegir a 0 y a t para obtener dos soluciones indepen- 
dientes. 

Demostremos ahora que la serie (6.32) cuyos coeficientes están definidos por 
(6.33) converge en el intervalo indicado. 


(*) Los lectores no familiarizados con la multiplicación de series de potencias pueden 
consultar el ejercicio 7 de la sección 6.21. 
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Elijamos un punto fìjo, x t ¥= x„ en el intervalo (x 0 — r, x 0 + r) y sea 
t = |*j — * 0 |- Puesto que las series que defìnen P t y P 2 convergen absolutamente 
para x = Xi los términos de esas series están acotados, pongamos 

\b k \ t k <, M x y | c k \t*£M t , 

para ciertos números M x > 0, M 2 > 0. Sea M el mayor de los dos números M x 
y tM 2 . Tenemos entonces 


l c *l * JSTi • 


La fórmula de recurrencia implica la desigualdad 


(» + 2 x» + 1 ) K +a l + 1 ) law.il + |a t | ^4 

jt—o * t ' 

= + «I a ^il + l«ol - K + il Í n+1 j 

£ 2( fc+ 2 > M + Kl = + 1) |a t | í+ 

w> / t k=0 


Hagamos ahora A 0 = |a 0 |, A x = [a x |, y defînamos /4 2 ,ì 4 3 , ... sucesivamente 
mediante la fórmula de recurrencia 


(6.34) 


(n + 2 )(n + 1 )A n , 


= £’î< 


(Â: + lM t í*= 


para n ^ 0. Entonces |a»| ^ >1„ para todo «^O, así que la serie £ a„(x - *o) B 
es mayorada por la serie J — * 0 |*. Aplicamos ahora el criterio del cociente 
para demostrar que 2 A„\x — x 0 | n converge si |x — * 0 | < t. 

Sustituyendo n por n - 1 en (6.34) y restando el producto de la ecuación 
por t- 1 de (6.34) encontramos que (n + 2)(n + l)A„ +2 — t-\n + l)nA n+1 = 
= M(n +2)A„ +1 . Por consiguiente 


y hallamos 


A„+2 \x 
A„+i [x 


= (n + l)n + (n + 2 )Mt 
2 ” +1 (n + 2)(n + l)í ’ 


x 0 r +2 _ (n + l)n + (n + 2)Mt 


\X - Xpj 


(n + 2 )(n + l)t 
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cuando n -> °°. Este límite es menor que 1 si \x — x 0 | < t. Luego £ <*«(x — x 0 ) n 
converge si \x — x 0 | < t. Pero ya que í = |jc a — x 0 | y que es un punto arbitra- 
rio en el intervalo (x a — r,x a + r), la serie 2 °«(x ~ x 0 ) n converge para todo x 
en (x 0 — r, x 0 + r). 

Los dos primeros coeficientes a 0 y a, representan los valores iniciales de y 
y de su derivada en el punto x 0 . Si u, es la serie de potencias solución con a 0 = 1 
y a x = 0, de manera que 


Mi(x 0 ) = l y uí(x o ) = 0, 

y u 2 la solución con a 0 = 0 y a x = 1, de tal modo que 
w*(xo) = 0 y u' 2 (x 0 ) = 1, 

entonces las soluciones u t y u 2 serán independientes. Esto completa la demos- 
tración. 

6.18 La ecuación de Legendre 

En esta sección encontramos series de potencias soluciones para la ecuación 
de Legendre, 

(6.35) (1 - x 2 )y" - 2xy' + a(a -f l)j = 0, 

donde a es cualquier constante real. Esta ecuación se presenta en problemas de 
atracción y de flujo de calor con simetría esférica. Cuando a es un entero positivo 
encontraremos que la ecuación tiene soluciones polinómicas llamadas polinomios 
de Legendre. Esos son los mismos polinomios que se encontraron al estudiar el 
proceso de Gram-Schmidt (capítulo 1, pág. 31). 

La ecuación de Legendre puede escribirse así: 

[(x* - 1)/]' = a(a + l)y, 

que -tiene la forma 

T(y) = Xy, 

en donde T es un operador de Sturm-Liouville, T(f) = (pfY, con p(x) = x 2 — 1 
y À = a(a + 1). Por consiguiente, las soluciones no nulas de la ecuación de Le- 
gendre son autofunciones de T correspondientes al autovalor a(a + 1). Puesto 
que p(x) satisface las condiciones de contorno 


p(i)=p(-i) = o, 
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el operador T es simétrico con respecto al producto interior 


(/> g) = J^/togC*) dx. 

La teoría general de los operadores simétricos nos dice que las autofunciones co- 
rrespondientes a autovalores distintos son ortogonales (teorema 5.3). 

En la ecuación diferencial tratada en el teorema 6.13 el coefìciente de y" es 1. 
La ecuación de Legendre puede ponerse en esa forma si dividimos por 1 — x 2 . De 
(6.35) obtenemos 


y" + Pi(x)y' + P 2 (x)y = 0, 

donde 

Pi(x) = - -^4 y P 2 (x) = f 

1 — X \ — x‘ 

si x 2 ¥= 1. Puesto que 1/(1 — x 2 ) = 2“ =0 x 2a para (x| < 1, P t y P 2 tienen ambos 
desarrollos en serie de potencias en el intervalo abierto ( — 1,1) así que el teorema 
6.13 es aplicable. Para encontrar la fórmula de recurrencia para los coeficientes 
es más sencillo dejar la ecuación en la forma (6.35) e intentar hallar una serie 
de potencias solución de la forma 


y = 


válida en el intervalo abierto ( — 1,1). Derivando esta serie término a término 
obtenemos 


y' y y" = 2«(« — 1 )a„x”~ 2 . 

Por lo tanto, tenemos 

2xy' =]£2 na„x" = 2 2na n x n , 

y 

(1 - x 2 )y" = |n(n - l)a B x"- 2 - f n(n - 1 )a n x n 

= J~( n + 2 X” + l) a n+2 x ” — 'ï.n(n — 1)íj„x" 
= 2 K« + 2)(n + l)a B+2 — n(n — l)a B ]x”. 
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Si sustituimos esas series en la ecuación diferencial (6.35), vemos que la ecuación 
se satisface si, y sólo si, los coeficientes satisfacen la relación 


(n + 2)(n + 1 )a n+i — n(n — 1 )a n — 2 na n + a(a + 1 )a n = 0 
para todo n ^ 0. Esta ecuación es la misma que 

(n + 2)(n + l)a„ +2 — (n — a )(n + 1 + a)a„ = 0, 


o 

(6.36) 


(a ~ n)(oL + n + 1 ) ^ 

(* + 1)(» + 2) 


Esta relación nos permite determinar a 2 , a it a e ,, sucesivamente en función de 
a 0 . Análogamente, podemos calcular a 3 , a s , a 7 ,..., en función de a x . Para los coe- 
ficientes con índices pares tenemos 


a 2 


a(a + 1 ) 

' " 0 a 0 . 


(a-2)(a + 3) , <x2 a(a - 2)(a + l)(a + 3) 

*-1+— a! = < " 1) -ïï- 

y, en general, 

„ a(a — 2) • • • (a — 2n + 2) • (a + l)(a + 3) • • • (a + 2« — 1) 


Esto puede demostrarse por inducción. Para los coeficientes con índices impares 
encontramos 


a — ( l) 71 (a ~ 2) •'•(« — 2w + 1) • (q + 2)(q + 4) • • • (q + 2n) 

(2n + 1)! fll ' 

Por consiguiente, la serie que define y puede escribirse así 
(6.37) y = a 0 Wi(*) + a ± u 2 (x), 

donde 

(6.3S) „ 

= i -|-NV_n n a ( a — 2) • • • (a — 2w + 2) • (q + l)(q + 3) • • • (a + 2n — 1) 2n 
zí (2 n)! 
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y 

( 6 - 39) 

u 2 (x) = x +2(- 1 )" 


(g - l)(a - 3) • • • (« - 2n + 1) • (a + 2)(g + 4) • • • (a + 2n) 2nH 
(2n + 1)! 


E1 criterio del cociente demuestra que cada una de esas series converge para 
|x| < 1. Asimismo, ya que la relación (6.36) se satisface separadamente por los 
coeficientes pares e impares, cada una de las funciones u^ y u* es una solución 
de la ecuación diferencial (6.35). Esas soluciones satisfacen las condiciones iniciales 


«x(0) = l, «í(0) = 0, u 2 (0) = 0, u 2 (0) = 1. 

Puesto que Ul y u 2 son independientes, la solución general de la ecuación de Le- 
gendre (6.35) en el intervalo abierto ( — 1,1) viene dada por la combinación 
lineal (6.37) con las constantes arbitrarias a 0 y a^. 

Cuando a es 0 o un entero par positivo, por ejemplo a = 2m, la serie de 
Ui(x) se transforma en un polinomio de grado 2m que sólo contiene potencias 
pares de x. Puesto que tenemos 


a(a - 2) • • • (oc - 2n + 2) = 2m(2m - 2) • • • (2m - 2n + 2) = - 2 m! 

(m — n)! 

(« + !)(« + 3) • • • (« + 2n - 1) = (2m + l)(2m + 3) • • • (2m + 2n - 1) 
_ (2m + 2n)! m! 

2 M (2m)! (m + n)! 


la fórmula que da Ul (x) en este caso se transforma en 


(6.40) 


«x(x) = 1 + 


(mjf y ( _ íf (2m + 2 k)\ %2t 

(2m!) (m-k)](m + k)l(2k)\ 


Por ejemplo, cuando « = 0, 2, 4, 6 (m = 0, 1, 2, 3) los polinomios correspon- 
dientes son 


Ul (x) = 1, 1 - 3x 3 , 1 — IOjc 2 + ^-x 4 , 1 - 2lx* + 63x 4 - ^ 1 * 6 . 


La serie que da u 2 (x) no es un polinomio cuando a es par debido a que el coefi- 
ciente de x 2n+1 nunca es cero. 

Cuando « es un entero impar, se invierten los papeles de Ul y u 2 ; la serie 
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correspondiente a u 2 (x) se convierte en un polinomio y la serie de u^(x) no es un 
polinomio. Concretamente, si « = 2 m + 1, tenemos 


(6.41) u 2 (x) = x + 


( m !) a 


(2m + 1) 




(2 m + 2 k+ 1)! 

(m - k)l (m + /c)!(2k + 1)!* 


Por ejemplo, cuando a = í, 3, 5 (m=0, 1, 2), los polinomios correspondientes son 


u 2 (x) = x, x - fx 3 , x - W + -Vx 5 . 


6.19 Polinomios de Legendre 


Algunas de las propiedades de las soluciones polinómicas de la ecuación de 
Legendre pueden deducirse directamente a partir de la ecuación diferencial o de 
las fórmulas (6.40) y (6.41). Otras se deducen más fácilmente partiendo de otra 
fórmula para esos polinomios que deduciremos ahora. 

Obtendremos primero una única fórmula que contiene (salvo factores cons- 
tantes) los polinomios (6.40) y (6.41). Pongamos 


(6.42) 


[ ««] 


(—l) f (2n - 2r)! 
r! (« — r)! (n — 2r)! 


x’ 


-2r 


donde [n/2] representa el mayor entero ^ n/2. Demostraremos luego que ése es 
el polinomio de Legendre de grado n introducido en el capítulo 1. Cuando n es 
par, es un múltiplo constante del polinomio «i(x) de la ecuación (6.40); cuando n 
es impar, es un múltiplo constante del polinomio u 2 (x) de (6.41). (*) Los siete 
primeros polinomios de Legendre vienen dados por las fórmulas 


Po(x) = 1, A(x) = x, P 2 (x) = i(3x 2 _ 1), P a ( x ) = i(5x 3 - 3x), 

P 4 (x) = i(35x 4 - 30x 2 + 3), P B (x) = H63x s - 70x 3 + 15x), 

P B (x) = à(23 lx s - 315X 4 + 105x 2 - 5). 

La figura 6.1 muestra las gráficas de las cinco primeras de esas funciones en el 
intervalo [ — 1, 1]. 


(*) Cuando n es par, n = 2 m, podemos reemplazar el índice de sumación k en (6.40) 
por otro r, siendo r = m — k; encontramos que la suma (6.40) es el producto de P„(x) por 
una constante. Análogamente, cuando n es impar. un cambio de índice transtorma la suma 
(6.41) en el producto de P„(x) por una constante. 
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y 



Figura 6.1 Grâficas de los polinomios de Legendre en el intervalo [ — 1.1] 

Podemos ahora demostrar que, salvo factores escalares, los polinomios de 
Legendre son los que se obtienen aplicando el proceso de ortogonalización de 
Gram-Schmidt a la sucesión de polinomios 1, x, x 2 , ..., con el producto interior 




Observemos primero que si m ¥= n íos polinomios P„ y P m son ortogonales 
porque son autofunciones de un operador simétrico pertenecientes a autovalores 
distintos. También, puesto que P„ tiene grado n y P 0 = 1, los polinomios 
P 0 (x), Pi(x),..., P„(x) engendran el mismo subespacio que l,x,... ,x n . En la 
sección 1.14, ejemplo 2, construimos otro conjunto ortogonal de polinomios 
yo ,yi ,y 2 , ■ ■ ■, tales que y 0 (*), yi(x), •.., y«(x) engendran el mismo subespacio 
que l,x,... ,x n para cada n. E1 teorema de ortogonalización (teorema 1.13) nos 
dice que, salvo factores escalares, existe un solo conjunto de funciones ortogonales 
con esa propiedad. Luego debe ser 


p n(x) = c n y n (x) 
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para ciertos escalares c„. E1 coeíìciente de x n en y„(je) es 1, así que c„ es el coefi- 
ciente de x n en P„(x). De (6.42) vemos que 

, = 

” 2"(n !) 2 

6.20 Fórmula de Rodrigues para los polinomios de Legendre 

En la suma (6.42) que define P„(x) observamos que 

(2" - 2r)! = £_ x tn- 2 r _ 1 = iM 

(n — 2r)! dx n r! (n — r)! n.'W ’ 


donde (") es el coeficiente binomial, y escribimos la suma en la forma 


, Jn Ín/2Ì 


Cuando [n/2] < r ^ n, el término x ìn ~ tr tiene grado menor que n, por lo que 
su derivada n-ésima es cero. Por consiguiente.no se altera la suma si hacemos que 
r recorra los valores de 0 a n. Esto nos da 


J»„(*) 


1 d n 
2"n! dx n 


2(-i) r (")x ,n - 2r . 


Vemos ahora que la suma del segundo miembro es el desarrollo del binomio 
(jc 2 — 1)". Por consiguiente, tenemos 


Ésta se conoce con el nombre de fórmula de Rodrigues, en honor de Olinde Ro- 
drigues (1794-1851), economista y reformador francés. 

Con la fórmula de Rodrigues y Ia ecuación diferencial, podemos deducir un 
número de propiedades importantes de los polinomios de Legendre. Algunas de 
esas propiedades se citan a continuación. Sus demostraciones están esbozadas en 
el conjunto de ejercicios que sigue. 

Para cada n ^ 0 tenemos 


J’níD = 1 • 
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Además, P„(x) es el único polinomio que satisface la ecuación de Legendre 

(1 - x*y - 2xy' + n(n + l)y = 0 

y vale 1 cuando x = 1. 

Para cada 0 tenemos 

PÁ-x) = (-l)"P„(x). 

Esto demuestra que P„ es una función par cuando n es par, y una función impar 
si n es impar. 

Ya hemos mencionado la relación de ortogonalidad, 

/_i P n (x)P m (x) dx = 0 si m jí n. 

Cuando m = n tenemos la expresión de la norma 

imil 2 = f (Pn(x)f dx =. 

J—i 2n + 1 

Todo polinomio de grado n puede expresarse como combinación lineal de po- 
linomios de Legendre P 0 ,P,,P„. En efecto, si / es un polinomio de grado n 
tenemos 


f(x) =J,C k P k (x), 

donde 

c * = ~ k ^ ^ f_/( x ) p i(x) dx. 

A partir de la relación de ortogonalidad resulta que 
L 1 ! g(x)P n (x) dx = 0 

para todo polinomio g de grado menor que n. Esta propiedad puede usarse para 
demostrar que el polinomio de Legendre P„ tiene n ceros reales y distintos situa- 
dos todos en el intervalo ( — 1,1). 

6.21 Ejercicios 


La ecuación de Legendre (6.35) 


= 0 tiene el polinomio solución u,(x) = 1 y 
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solución no polinómica, dada por la serie (6.41). 

a) Demostrar que la suma de la serie que da u 2 viene dada por 

1 , 1 +* 

u 2 (x) = - log j—- para |jc| < 1. 

b) Comprobar directamente que la función u 2 de la parte • a) es una solución de la 
ecuación de Legendre cuando a = 0. 

2. Demostrar que la función / definida por la ecuación 

f(x) = 1 - j log 

para |x| < 1 satisface la ecuación de Legendre (6.35) con a = 1. Expresar esta función 
como combinación lineal de las soluciones u t y u 2 dadas por las ecuaciones (6.38) y 
(6.39). 

3. La ecuación de Legendre (6.35) puede escribirse en la forma 

[(** - 1)/]' - a(a + \)y = 0. 

a) Si a, b, c son constantes siendo a>by4c+l>0, demostrar que la ecuación dife- 
rencial del tipo 


[(x - a)(* - %']' - cy = 0 

puede transformarse en una ecuación de Legendre mediante un cambio de variable de 
la forma X = At + B, con A > 0. Determinar A y B en función de o y b. 
b) Utilizar el método sugerido en la parte a) para transformar la ecuación 


(x 2 - x)y" + (2x - 1)/ - 2y = 0 


en una ecuación de Legendre. 

4. Hallar dos soluciones independientes, en forma de serie de potencias, de la ecuación 
de Hermite 


y" - 2xy' + 2ay = 0 

en un intervalo de la forma (—r,r). Demostrar que una de esas soluciones es un poli- 
nomio cuando a es entero no negativo. 

5. Hallar una serie de potencias solución de la ecuación diferencial 

xy" + (3 + x?)y' + 3x*y = 0 

válida para todo x. Hallar una segunda solución de la forma y = x~* V <wr" válida para 
x ^ 0. ^ 

6. Hallar una serie de potencias solución de la ecuación diferencial 


x 2 y" + x*y' - (ccx + 2)y = 0 
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válida en un intervalo de la forma (— r,r). 

7. Dadas dos funciónes A y B analíticas en un intervalo (*> — r, x* + r), 

A(x) = f a n (x - x 0 ) n , B(x) = J b n (x - x 0 ) n . 

«= 0 n =0 

Puede demostrarse que el producto C(x) = A(x)B(x) es también analítica en (x 0 — r, 
x„ + r). Este ejercicio demuestra que C tiene el desarrollo en serie de potenoias 


C(x) = 2 c n (x - x 0 ) n , donde c„ = 2 a iJ>n~k • 

n-0 k =0 

a) Con la regla de Leibniz para la derivada n-ésima de un producto demostrar que la 
derivada n-ésima de C viene dada por 

C (B »W =ỲQa^(x)B^(x). 

b) Hacer uso del hecho de que A (W (xo) = kla t y B ( "' s, (jto) = (n — k)\ b„. k para obtener 

Cb"(x 0 ) = nìfatb^. 

k-0 

Puesto que C w (x 0 ) = n! c„, queda demostrada la fórmula que da c„. 

En los ejercicios del 8 al 14, P„(x) designa el polinomio de Legendre de grado n. Esos 
ejercicios dan el esquema de las demostraciones de las propiedades de los polinominos de 
Legendre descritas en la sección 6.20. 

8. a) Con la fórmula de Rodrigues demostrar que 

P n (.x) = j n (x + 1)" + (x - 1 )Q n (x), 
donde Q„(x) es un polinomio. 

b) Demostrar que P„(l) = 1 y que P„(— 1) = (—1)’. 

c) Demostrar que P„(x) es el único polinomio solución de la ecuación de Legendre 
(con a = n) que tiene valor 1 cuando x = 1. 

9. a) Utilizar las ecuaciones diferenciales a las que satisfacen P„ y P m para demostrar que 

[(1 - x*)(P n P’ m - P’ n PJ\ = [„(„ + i) _ m{m + i )] Pn P m . 

b) Si m n, integrar la ecuación del apartado a) desde — 1 a 1 para dar otra demos 
tración de la relación de ortogonalidad 

f^P„(x)P m (x)dx= 0. 
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10. a) Sea f(x) = (x 2 - 1)". Con la integración por partes demostrar que 


/* 1 /< B, (jc)/<” , (Jc) dx - /* i /‘ b+ 1 , (jc)/<"- 1, (*) dx. 


Aplicar esta fórmula reiteradamente para deducir que la integral del primer miembro 
es igual a 


2(2n)lJ\l - jc 2 ) b dx. 

b) La sustitución x = cos t transforma la integral JJ (1 — x 1 )’ dx en Jj /2 sen 2 ” +1 / dt. 
Emplear la relación 


r 


sin an+1 1 dt 


2n(2n - 2) • • • 2 
(2n + 1)(2« - 1) • •• 3 • 1 


y la fórmula de Rodrigues para obtener 


Xli^nÍJc)] 2 C*C 


2 

2n + 1 ‘ 


11. a) Demostrar que 


P n (x) 


( 2 «)! 

2 B («!) 2 * 


donde Q„( x) es un polinomio de grado menor que n. 

b) Expresar el polinomio f(x) = x* como combinación lineal de P„, Pi, Pi, Ps, y P<. 

c) Demostrar que todo polinomio / de grado n puede expresarse como combinación 
lineal de los polinomios de Legendre P 0 , Pi, .... P„. 

12. a) Si / e's un polinomio de grado n, escribir 

f(x) =j^c k P k (x). 


[Esto es posible según el ejercicio 11 c).] Para un m fijo, 0 < m < n, multiplicar ambos 
miembros de esa ecuación por PJ(x) e integrar entre — 1 y 1. Teniendo en cuenta los 
ejercicios 9 b) y 10 b) deducir la relación 

c m = — J f(x)P m (x) dx. 

13. Utilizar los ejercicios 9 y 11 para demostrar que Ji t g(x)P„(x) dx = 0 para todo polinomio 
g de grado menor que n. 
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14. a) Con el auxilio del teorema de Rolle demostrar que P„ no puede tener ceros múltiples 
en el intervalo abierto (—1,1). Es decir, los ceros de P„ que están en (—1,1) deben 
ser ceros simples. 

b) Supongamos que P„ tiene m ceros en el intervalo (—1,1). Si m = 0, sea Q 0 (x) = 1. 
Si m > 1, sea 

Qm(x) = (x - Xj)(x - x 2 ) ■ ■ ■ (x - x m ), 

donde Xi,x 2 , son m ceros de P„ en (—1, 1). Demostrar que, en cada punto x de 

(—1,1), QJx) tiene el mismo signo que P„(x). 

c) Con el apartado b) y el ejercicio 13, demostrar que la desigualdad m <n nos lleva 
a una contradicción. Esto demuestra que P„ tiene n ceros reales distintos, todos situados 
en el intervalo abierto (—1,1). 

15. a) Demostrar que el valor de la integralJ 1 ^ P n (x)P' n+1 (x) dx es independiente de n. 
b) Calcular la integral JV^ x / > «(x)P n _ 1 (x) dx . 


6.22 Método de Frobenius 

En la sección 6.17 aprendimos a encontrar soluciones, en forma de series de 
potencias, de la ecuación diferencial 

(6.43) y" + Pi(*y + PÁx)y = 0 

en un entorno del punto x 0 en el que los coeficientes P 2 y P 2 son analíticos. Si uno 
de los dos P 2 o P 2 no es analítico en las proximidades de x 0 , pueden o no existir 
series de potencias solución en el entorno de x 0 . Por ejemplo, supongamos que in- 
tentamos encontrar una serie de potencias solución de la ecuación diferencial 

(6.44) x 2 y" - y' - y = 0 

en un entorno de x 0 = 0. Si suponemos que existe una solución y = 2 y la 
sustituimos en la ecuación diferencial, llegamos a la fórmula de recurrencia 



Si bien esto nos da una serie de potencias y = 2 akX k que formalmente satis- 
face (6.44), el criterio del cociente pone en evidencia que esa serie converge única- 
mente para x = 0. Así pues, no existe serie de potencias solución de (6.44) válida 
en cualquier intervalo abierto en torno a x 0 = 0. Este ejemplo no contradice el 
teorema 6.13 porque cuando ponemos la ecuación (6.44) en la forma (6.43) encon- 
tramos que los coeficientes P 2 y P 2 vienen dados por 

J_ 

x 2 


PÁx) = - 


y páx ) = - 
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Estas funciones no admiten desarrollo en serie de potencias en torno al origen. 
La dificultad aquí radica en que el coeficiente de y" en (6.44) tiene el valor 0 
cuando x = 0; es decir, la ecuación diferencial tiene un punto singular en x = 0. 

Para apreciar las dificultades que se presentan en la investigación de las 
ecuaciones diferenciales en las proximidades de un punto singular es necesario 
conocer la teoría de funciones de variable compleja. Sin embargo, algunos casos 
particulares de ecuaciones con puntos singulares pueden tratarse con métodos 
elementales. Por ejemplo, supongamos la ecuación diferencial (6.43) equivalente 
a una ecuación de la forma 

(6.45) (x - x 0 )Y + (x- x 0 )P(x)y' + Q(x)y = 0, 

donde P y Q tienen desarrollos en series de potencias en un cierto intervalo abier- 
to (x 0 — r,x 0 + r). En este caso decimos que x 0 es ftn punto singular regular de 
la ecuación. Si dividimos ambos miembros de (6.45) por (x — x 0 ) 2 la ecuación se 
transforma en 


Q(x) 

' (x-xj 


y = o 


para x ¥=■ x 0 . Si P(x 0 ) # 0 o Q(x„) # 0, o si Q(x„) = 0 y Q'(x 0 ) ¥= 0, o el coefi- 
ciente de / o el de y no tendrá desarrollo en serie de potencias en tomo al punto 
x 0 , así que el teorema 6.13 no es aplicable. En 1873 el matemático alemán Jorge 
Frobcnius (1849-1917) desarrolló un método muy práctico para tratar tales ecua- 
ciones. Enunciaremos el teorema de Frobenius pero no daremos su demostra- 
ción. (*) En la sección siguiente damos los detalles de la demostración para un 
caso particular importante, la ecuación de Bessel. 

E1 teorema de Frobenius se desdobla en dos partes, que dependen de la 
naturaleza de las raíces de la ecuación cuadrática 


(6.46) t(t - 1) + P(x 0 )t + Q(x 0 ) = 0. 

Esta ecuación cuadrática se llama la ecuación de índices de la ecuación diferencial 
dada (6.45). Los coeficientes P(x„) y Q(x„) son los términos constantes de los 
desarrollos de P y Q en series de potencias. Sean a x y a 2 las raíces de la ecuación 
de índices. E1 tipo de solución que se obtiene por el método de Frobenius de- 
pende de si esas raíces difieren o no en un número entero. 


(*) Para la demostración véase E. Hille, Analysis, Vol. II, Blaisdell Publishing Co., 
1966, o E. A. Coddington, An Introduction to Ordinary Differential Equations, Prentice-Hall, 
1961. 
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TEOREMA 6.14. PRIMER CASO DEL TEOREMA DE FROBENIUS. Sean «i y a 2 las 
raíces de la ecuación de índices y supongamos que ai — a 2 no es un entero. En- 
tonces la ecuación diferencial (6.45) tiene dos soluciones independientes Ui y u 2 
de la forma 

(6.47) m x (x) = |x — — x 0 )”, con a 0 = 1, 

y 

(6.48) " 2 O) = \X- x o rïb n (x - x o r, con b 0 = 1. 

Ambas series convergen en el intervalo \x — * 0 | < r, y la ecuación diferencial se 
satisface para 0 < — x 0 | < r. 

TEOREMA 6.15. SEGUNDO CASO DEL TEOREMA DE FROBENIUS. Sean a x y a 2 
las raíces de la ecuación de índices y supongamos que a x — a 2 = N es un entero 
no negativo. Entonces la ecuación diferencial (6.45) tiene una solución u x de la 
forma (6.47) y otra solución independiente u 2 de la forma 

U 2 (x) = |x — Xol^J^nO — X 0 )” + c Mi(x) log |x — X 0 | , 


donde b 0 = 1. La constante C no es nula si N = 0. Si N > 0, la constante C 
puede 0 no ser cero. Como en el caso 1, ambas series convergen en el intervalo 
\x — x 0 | < r, y las soluciones son válidas para 0 < |x — x 0 | < r. 

6.25 Ecuación de Bessel 

En esta sección utilizamos el método sugerido por Frobenius para resolver 
la ecuación de Bessel 

(6.49) x 2 y" + xy' + (x 2 — a?)y = 0, 

donde a es una constante no negativa. Esta ecuación se emplea en problemas rela- 
tivos a vibraciones de membranas, flujo de calor en cilindros, y propagación de 
corrientes eléctricas en conductores cilíndricos. Algunas de sus soluciones se co- 
nocen con el nombre de funciones de Bessel. También se presentan esas funciones 
en Teoría de Números. La ecuación tomó el nombre del astrónomo alemán 
F. W. Bessel (1784-1846), si bien ya aparece en las investigaciones de Daniel 
Bernoulli (1732) y de Euler (1764). 

La ecuación de Bessel tiene la forma (6.45) con x n = 0, P(x) = 1, y 
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Q(x ) = x 2 — a 2 , de modo que el punto x 0 es un punto singular regular. Puesto 
que P y Q son analíticas en toda recta real, intentamos encontrar soluciones de 
la forma 

(6.50) ? = 1 * 1*2 <*«*"> 

con a 0 + 0, válida para todo x real con la posible excepción de x = 0. 

Primero mantenemos x > 0, de modo que x * = x*. La derivación de (6.50) 
nos da 


y' = tx* ^anx” + = x* -1 2(n + t)a n x n . 


Análogamente, obtenemos 


y" = x* -2 £ (n + t)(n + t - 1 )a n x n . 

Si L(y) = x 2 y" + xy' + (x* — a?)y, encontramos 
L(y) — x*2(« + 0(" + t — l)a„x” + x* J (n + t)a n x n 

+ x*2a„x M+2 - x*2a*a„x" = x‘2t(n + 0* - + x‘Jfl„x" +! . 


Pongamos ahora L(y) = 0, suprimamos x*, e intentemos determinar los de modo 
que el coeficiente de cada potencia de x se anule. Para el término independiente 
es necesario que (f 2 — « 2 )a 0 = 0. Como quiera que buscamos una solución con 
a 0 ¥ 0, esto exige que 

(6.51) /* — a* = 0. 

Ésta es la ecuación de índices. Sus raíces a y —« son los únicos valores posibles 
de t que nos pueden dar una solución del tipo deseado. 

Consideremos primero t — a. Para esta t, las ecuaciones restantes para la 
determinación de los coeficientes se transforman en 

(6.52) [(1 + a) 2 — a 2 ]ai = 0 y [(n + a) 2 — a 2 ]a„ + a„_ 2 = 0 

para 2. Puesto que a z 0, la primera de esas implica que = 0. La segunda 
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fórmula puede escribirse en Ia forma 

< 6 - 53 > — 

con lo que a 3 = a 5 = a 7 = ... = 0. Para los coefìcientes con índices pares te- 
nemos 


a = ~ a ° 

2 2(2 + 2a) 

a 6 

y, en general 


__~fo Q _ ~ a 2 _ (-l) 2 Un 

2 2 (1 + «) ’ 4 4(4 + 2«) 2 4 2!(1 + «)(2 + «)’ 

^ ~ fl 4 _ _ (-1)%, _ 

6(6 + 2«) 2*3! (1 + «X2 + «)(3 + «) ’ 


2 2 "n!(l + «)(2+ «)•••(„ + «)• 


Por consiguiente.la elección t = a nos da la solución 




(—1)V” 


2 in n! (1 + «)(2 + a) • • • (n + «)/ 


E1 criterio del cociente demuestra que la serie de potencias que aparece en esta 
fórmula converge para todo * real. 

En esta discusión hemos supuesto que x > 0. Si x < 0 podemos repetirla 
reemplazando x* por (—xf. Encontramos nuevamente que t debe satisfacer la 
ecuación t 1 — o? — 0. Haciendo t = a obtenemos la misma solución, salvo que el 
factor externo x* queda reemplazado por (— x) a . Por tanto la función f. x dada por 
la serie 


(6.54) 


/«w = «o i*r 


h? 


(-l)V* 


tí2 2 ”n!(l + «)(2 + «)-••(« + «)/ 


es una solución de la ecuación de Bessel válida para todo real x ¥= 0. Para los va- 
lores de a para los que existen f a (0) y /'(0), la solución también es válida para 
x = 0. 

Consideremos ahora la raíz t = — a de la ecuación de índices. Obtenemos en 
Iugar de (6.52), las ecuaciones 


[(1 - «)* - « 2 ] fll = 0 y 


[(n — a) 2 — a 2 ]a„ + a n _ 2 = 0, 
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que se convierten en 

(1 — 2a )#! = 0 y n(n — 2a )a n + a n _ 2 = 0. 

Si 2« no es entero esas ecuaciones nos dan a x = 0 y 
a = _ a "-s 

n(n — 2a) 

para n^2. Puesto que esta fórmula de recurrencia es la misma que (6.53), con a 
sustituida por — a, llegamos a la solución 

(6.55) U* - «. W (l +1 2 ,.„, (1 _ 


válida para todo real x¥= 0. 

La solución /_ a se obtuvo en la hipótesis de que 2a no es un entero positivo. 
No obstante, la serie que da /_ a tiene sentido incluso si 2a es un entero po- 
sitivo, en tanto que a no sea entero positivo. Puede comprobarse que / _« satisface 
la ecuación de Bessel para tal valor a. Por consiguiente, para cada a 2: 0 tenemos 
la serie solución / a , dada por (6.54); y si a no es un entero no negativo hemos en- 
contrado otra solución /_ a dada por (6.55). Las dos soluciones / a y /_ a son inde- 
pendientes, ya que una de ellas «> cuando x -> 0, y la otra no. Seguidamente 
simplificaremos la forma de las soluciones. Para ello necesitamos algunas propieda- 
des de la función gamma de Euler que brevemente vamos a recordar. 


Para cada real s > 0 definimos T(s) mediante la integral impropia 
r ( s > = £ f-'e-'dt. 

Esta integral converge si s > 0 y diverge si s ^ 0. La integración por partes nos 
conduce a la ecuación funcional 

(6.56) T(s+1) = sT(s). 

Esto implica que 

r(s + 2) = (s + i)r(s + i) = (s + i)s r(s), 

T(s + 3) = (s + 2)r(s + 2) = (s + 2) (s + l)s T(s), 


y, en general 
(6.57) 


T(s + rì) = (s + n — 1) • • • (s + l)s T(s) 
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para todo entero positivo n. Puesto que r(l)= j e~* dt = 1, cuando ponemos 
s = 1 en (6.57) encontramos 

r(n + 1) = n!. 


Así pues, la función gamma es una extensión de la función factorial de los ente- 
ros a los números reales positivos. 

La ecuación funcional (6.56) puede usarse para extender la defìnición de 
T(s) a valores negativos de s que no sean enteros. Escribamos (6.56) en la forma 


(6.58) 


T(s) = 


r (s +1 ) 


E1 segundo miembro tiene sentido sis + l>0ys#0. Por consiguiente, pode- 
mos usar esa ecuación para definir T(s) si — 1 < s < 0. E1 segundo miembro de 
(6.58) tiene ahora sentido si s + 2 > 0, s¥= — 1, s#0, y podemos usar esa 
ecuación para definir r(s) para — 2 < s < — 1. Continuando así, podemos exten- 
der la definición de r(s) por inducción a cualquier intervalo abierto de la forma 
—n<s<—n+ 1, donde n es un entero positivo. La ecuación funcional (6.56) y 
su extensión (6.57) son ahora válidas para todo real s para el que ambos miem- 
bros tengan sentido. 


Volvamos ahora a la discusión de la ecuación de Bessel. La serie que da f a 
en la ecuación (6.54) contiene el producto (1 +«) (2 + «)... (n + «). Podemos 
expresar este producto mediante la función gamma tomando s = 1 + a en (6.57). 
Esto nos da 


(1 + «)(2 + «)••• (n + «) = Hg - tJ + «) . 

r(i + «) 

Por consiguiente, si elegimos- a Q = 2~“/r(l + «) en (6.54) y designamos la fun- 
ción resultante f a (x) por J a (x) cuando x > 0, la solución para x > 0 puede escri- 
birse en la forma 


(6.59) 


J'(x) = 



— í=m —/ïf. 

nir(n + I + «)\2/ 


La función J a definida por esta ecuación para x>0y«^0se llama función de 
Bessel de primera especie y de orden «. Cuando a es un entero no negativo, sea 
a = p, la función de Bessel J P viene dada por la serie de potencias 




(-1)" IxŶ n+ » 
n!(n + p)!\2/ 


(p = 0,1,2,...). 



Ecuación de Bessel 


229 


Ésta es también solución de la ecuación de Bessel para x < 0. Se han construido 
tablas de funciones de Bessel. En la figura 6.2 se han dibujado las gráficas de las 
dos funciones de Bessel / 0 y J t . 


y 



Figura 6.2 Gràficas de las funciones de Bessel /o y /i. 

Podemos definir una nueva función /_« reemplazando a por —a en la 
ecuación (6.59), si a es tal que T(n + 1 — <*) tiene sentido; esto es, si a no es un 
entero positivo. Por consiguiente, si x > 0 y a > 0, « ¥= 1,2,3,..., definimos 




Tomando s = 1 — « en (6.57) obtenemos 

T(« + 1 — a) = (1 — a) (2 — a) • • • (n — «) T(1 - «) 

y vemos que la serie que da J- a (x) es la misma que la de f- x (x) de la ecuación 
(6.55) con a 0 = 2“/r(l — a), x > 0. Por lo tanto, si a no es entero positivo, /_ a 
es una solución de la ecuación de Bessel para x > 0. 

Si a no es entero, las dos soluciones J a (x) y J- X (x) son linealmente indepen- 
dientes en el eje reai positivo (puesto que su cociente no es constante) y la solución 
general de la ecuación de Bessel para x > 0 es 

y = ^J a (x) + c^x). 

Si a es un entero no negativo, sea « = p, hemos encontrado únicamente la 
solución / p y sus productos por constantes válidos para x > 0. Otra solución, 



230 


Ecuaciones diferenciales lineales 


independiente de ésta, puede encontrarse por el método descrito en el ejercicio 4 
de la sección 6.16. Éste establece que si u x es una solución de /'+Pi/+P 2 y =0 
que nunca se anula en un intervalo /, una segunda solución u 2 independiente de 
viene dada por la integral 

ionde Q(x) = e~i p i (x)dx . Para la ecuación de Bessel tenemos P^ix) = \/x, así 
que Q(x) = 1/x y una segunda solución u 2 viene dada por la fórmula 

( 6 . 6 °) 

si c y x pertenecen al intervalo / en el que / p no se anula. 

Esta segunda solución puede ponerse en otras formas. Por ejemplo, a partir 
de (6.59) podemos escribir 


—-— = — g (í) 

[J P (t)f t 2 * 

donde g p (0) ¥= 0. En el intervalo / la función g p tiene un desarrollo en serie de 
potencias 

gv(t)=Î.A n t n 

n=0 

que podría determinarse igualando coeficientes en la identidad g P (í)[/ P (í)] 2 = í zp . 
Si suponemos la existencia de tal desarrollo, el integrando de (6.60) toma la forma 

1 _ J_ -y A „ 

t[J v (t)f t 2 ^ 1 ^ nt ' 

Integrando esta fórmula término a término entre c y x obtenemos un término loga- 
rítmico A 2V log x (de la potencia < _1 ) más una serie de la forma xr 2p 2 #«*”• 
Por consiguiente, (6.60) toma la forma 

u 2 (x) = A 2v J v (x ) log x + J v (x)x~ 2v J t B n x n . 

Puede demostrarse que el coeficiente + 2P ¥= 0. Si multiplicamos u^x) por 1 /A 2p la 
solución que resulta se designa con K p (x) y tiene la forma 


K v (x) = J v (x) log x + x~ v 2 C n x n . 
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Esta es la forma de la solución anunciada en el segundo caso del teorema de 
Frobenius. 

Habiendo llegado a esta fórmula, podemos comprobar que existe realmente 
una solución de esta forma sustituyendo en el segundo miembro de la ecuación 
de Bessel y determinando los coefìcientes C„ de modo que la ecuación se satisfaga. 
Los detalles de este cálculo son largos y serán omitidos. E1 resultado fìnal puede 
expresarse así 




donde /i 0 = Oy/i«=l+i + ... + 1 /n para n 2: 1 . La serie del segundo miem- 
bro converge para todo real x. La función K p defìnida para x>0 por esa fórmula se 
llama función de Bessel de segunda especie y de orden p. Puesto que K p no es el 
producto de una constante por } p , la solución general de la ecuación de Bessel en 
este caso para x > 0 es 


y = c x J v (x) + c 2 K v (x). 

En los ejercicios que siguen se discutirán otras propiedades de las funciones de 
Bessel. 


6.24 Ejercicios 


1. a) Sean / una solución cualquiera de la ecuación de Bessel de orden a y g(x) = *%/(*) 
para x > 0. Demostrar que g satisface la ecuación diferencial 

» /, 1 - 4a 2 \ 

’ + (' 

b) Cuando 4 a 1 = 1 la ecuación diferencial del apartado a) se transforma en y" + y = 0; 
su solución general es y = Acosx + Bsenx. Utilizar esa información y la igualdad (*) 
r(ì) = v 7 P para demostrar que, para x > 0, 



(*) E1 cambio de variable t = u* nos da 

T(è) = /o+ àt = 2 du = . 

(En el ejercicio 16 de la sección 11.28 puede verse una demostración de que 
V~.) 
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c) A partir de las series que dan fi A (x) y / _i A (x), deducir directamente ias fórmulas 
del apartado b). 

2. Utilizar la representación en series de potencias de las funciones de Bessel para demos- 
trar que 

a) éc (X * J * Çx)) =W -iW' 

d 

h) ±c (X * J * (X)) = 

3. Sean FJx) = x*JJx) y GJx) = x~*JJx) para x > 0. Obsérvese que cada cero positivo 
de /» es un cero de F* y también lo es de G*. Con el teorema de Rolle y el ejercicio 2 
demostrar que los ceros de J a y /„ +l se intercalan. Esto es, existe un cero de ]* entre 
cada par de ceros positivos de }* + i, y un cero de f a+1 entre cada par de ceros posi- 
tivos de f*. (Ver figura 6.2.) 

4. a) A partir de las relaciones del ejercicio 2 deducir las relaciones de recurrencia 

l JJx) + JJx) = J x _Jx) y ^ JJx) - J'Jx) = J a+ 1 (x). 

b) Con las relaciones del apartado a) deducir las fórmulas 

Vi(*) + 4+ito = 7 JJx) y J,_Jx) - J x+ Jx) = 2 J'Jx). 

5. Utilizar el ejercicio 1 b) y una fórmula de recurrencia adecuada para demostrar que 



Hallar una fórmula análoga para J_» A (x), Observación: JJx) es una fUiìción elemental 
para todo a que sea la mitad de un entero impar. 

6. Demostrar que 


\ í (J * (X) + J * +i(x)) = l J * (x) ~ ’ L ir J * +i(x) 

y 

^ (xJJx)J a+ Jx)) = x(Jjx) - Jj+Jx )). 

7. a) Usar las identidades del ejercicio 6 para demostrar que 

J 2 o(x) + 2 f Jjx) =1 y f (2n + ì)J n (x)J n+ Jx) = t x. 

b) Del apartado a) deducir que |/ 0 (x)| S 1 y |/„(jc)| <,^^2 para n = 1,2,3,..., y 
todo x > 0. 
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8. Sea g x (x) = x 1A f a ,(ax b ) para x > 0, donde a y b son constantes no nulas. Demostrar que 
g a satisface ecuación diferencial 

x 2 y* + (a 2 b 2 x îb + i - tx 2 b 2 )y = 0 

si, y sólo si, /« es una solución de la ecuación de Bessel de orden a. 

9. Hacer uso del ejercicio 8 para expresar la solución general de cada una de las ecuacio- 
nes diferenciales siguientes por medio de las funciones de Bessel para x > 0. 

a) y" + xy = 0 . c) y“ + x m y = 0. 

b) y“ + x 2 y = 0. d) **/ + (x* + i)y = 0. 

10. Generalizar el ejercicio 8 cuando /, y A se relacionan mediante la ecuación 
g x (x) = x c f x (ax^) para x > 0. Hallar entonces la solución general de las siguientes 
ecuaciones por medio de las funciones de Bessel para x > 0. 

a) xy" + 6/ + y = 0. c) xy" + 6/ + x*y = 0. 

b) xy" + 6y' + xy = 0. d) x*y" - xy' + (x + l)j = 0. 

11. Dada la identidad de la forma 

J t (x) — J 0 (x) = aj"(x), 

donde a y c son constantes. Determinar a y c. 

12. Encontrar una serie de potencias solución de la ecuación diferencial xy" + y' + y = 0 
convergente para — = < x < + =. Demostrar que para x > 0 puede expresarse median- 
te una función de Bessel. 

13. Consideremos una ecuación diferencial lineal de segundo orden de la forma 

x 2 A(x)y" + xP(x)y’ + Q(x)y = 0, 

en la que A(x), P(x), y Q(x) admiten desarrollos en series de potencias, 


A (x) =^£a k x k , P(x)=J^ Ple x k , Q(x) = 2 q k x k , 


con «o 0, convergente cada una en un intervalo abierto (— r,r). Si la ecuación dife- 
rencial tiene una serie solución de la forma 

y = 

válida para 0 < x < r, demostrar que t satisface una ecuación cuadrática de la forma 
P + bt + c = 0, y determinar b y c en función de los coeficientes de las series de 
A(x), P(x) y Q(x). 

14. Considerar un caso particular del ejercicio 13 en el que A(x) = 1 — x, P(x) = J y 
Q(x) = — Jx. Hallar una serie solución con t no entero. 

15. La ecuación diferencial 2}py” +(x 2 — x)y' + y = 0 tiene dos soluciones independientes 
de la forma 


y c n x n , 

n~ 0 
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válida para x > 0. Determinar esas soluciones. 

16. La ecuación diferencial no lineal y" + y + aý — 0 es «ligeramente» no lineal si' a es una 
constante pequeiia no nula. Supongamos que existe una solución que puede expresarse 
como serie de potencias de a de la forma 

y = ^ u n W a " (válido en un cierto intervalo 0<a<r) 


y que esta solución satisfaga las condiciones iniciales y = 1 e y' = 0 cuando x = 0. 
Para ajustarse a esas condiciones iniciales, intentamos elegir los coeficientes u„(x) de 
modo que « 0 (0) = l y «'(0)= 0 y «„(0) =u' n (0) = 0 para n > 1. Sustituir esa serie en la 
ecuación diferencial, igualar las potencias adecuadas de a y determinar con ello t/c(x) 
y u,(x). 
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7.1 Introducción 

Aunque el estudio de las ecuaciones diferenciales comenzó en el siglo xvn, 
no fue hasta el xix que los matemáticos se dieron cuenta que un número relativa- 
mente pequeno de ecuaciones diferenciales podía resolverse con medios elemen- 
tales. Los trabajos de Cauchy, Liouville y otros, mostraron la importancia de 
establecer teoremas generales para garantizar la existencia de soluciones para 
ciertas clases especiales de ecuaciones diferenciales. E1 capítulo 6 se dedicó al 
empleo de un teorema de existencia y unicidad en el estudio de las ecuaciones 
diferenciales lineales. En este capítulo nos interesamos en una demostración de 
ese teorema y en temas relacionados con éî. 

La teoría de existencia para ecuaciones diferenciales de orden superior puede 
reducirse al caso de primer orden introduciendo sistemas de ecuaciones. Por ejem- 
plo, la ecuación de segundo orden 

(7.1) y” + 2tý — y = e‘ 

puede transformarse en un sistema de dos ecuaciones de primer orden introdu- 
ciendo dos funciones incógnitas e y 2 , siendo 

yi = y, y 2 = yí- 

Tenemos entonces / 2 = y' = y", así que (7.1) puede escribirse como un sistema 
de dos ecuaciones de primer orden: 


y* = yi - 2ty z + e*. 

No podemos resolver las ecuaciones separadamente con los métodos del capítulo 6 
porque cada una de ellas contiene dos funciones incógnitas. 
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En este capítulo consideramos sistemas que constan de n ecuaciones dife- 
renciales lineales de primer orden con n funciones incógnitas y, ,..., y„. Esos 
sistemas tienen la forma 


(7.3) 


yí = PuiOyi + Pi 2 (t)y 2 + ■■■ + p ln (t)y„ + q x (t) 


y'n = Pm(t)yi + p n2 (t)y 2 + • • • + p nn (t)y n + q n (t). 


Las funciones p,k y q, que aparecen en (7.3) se consideran funciones dadas defini- 
das en un cierto intervalo /. Las funciones y x ,..., y n son las funciones incógnitas 
que hay que determinar. Los sistemas de este tipo se llaman sistemas lineales de 
primer orden. En general cada ecuación del sistema contiene más de una función 
incógnita por lo cual las ecuaciones no pueden resolverse separadamente. 

Una ecuación diferencial lineal de orden n siempre puede transformarse en 
un sistema. Supongamos que la ecuación de orden n dada es 

(7.4) /"> + a x y+ • • • + a n y = R(t), 

donde los coeficientes ai son funciones dadas. Para transformarla en un sistema 
escribimos = y e introducimos una nueva función incógnita para cada una de 
las sucesivas derivadas de y. Esto es, ponemos 

yi = y, y 2 = yí, y 3 = yí, ■ ■ •, y n = y n - lt 

y escribimos (7.4) como sistema 

yí = y 2 

yí = y 3 


(7.5) 


y'n-i = y n 

y'n = -a n yi - a n -!y 2 -- a^ + R(t). 


La discusión de los sistemas puede simplificarse considerablemente mediante 
1a notación matricial y vectorial, Consideremos el sistema general (7.3) e intro- 
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duzcamos las funciones vectoriales Y = (y, ,..., y„), Q — (çt ,, q„), y una 
función matricial P = [p,,], definidas por las écuaciones 

Y(t) = 0>i(0, • • • , 7„(0), 6(0 = (ffi(0, • • • , ?,(0), i’íO = [p«(0] 

para cada t de /. Consideremos los vectores como matrices columna nXl y es 
cribamos el sistema (7.3) en la forma más sencilla 

(7-6) Y' = P(t)Y + Q(t). 

Por ejemplo, en el sistema (7.2) tenemos 



En el sistema (7.5) tenemos 




0 1 0 ••• 01 


“ 0 " 

yi 

yi 


00 1 ... o 


0 

_y«_ 

, p( t) = 

0 0 0 ••• • 1 

_—a n —a n _y —a n _ 2 • • • —a^_ 

, 6(0 = 

0 

_*(0_ 


Un problema de valores iniciales para el sistema (7.6) es el de encontrar una 
función vectorial Y que satisfaga (7.6) y también una condición inicial de la 
forma Y(a) = B, donde a & J y B = (b,,... ,b„) es un vector n-dimensional 
dado. 

En el caso n = 1 (el caso escalar) sabemos según el teorema 6.1 que, si 
P y Q son cominuas en /, todas las soluciones de (7.6) vienen dadas por la fórmula 

(7.7) y(x) = e Aíx) Y(a) + J* e~ AW Q(t) dt, 

donde A(x) = J* P(t) dt, y a es un punto cualquiera de /. Demostraremos que 
esta fórmula puede generalizarse en forma adecuada para sistemas, esto es, cuando 
P(t) es una función matricial nXn y Q(t) una función vectorial de dimensión n. 
Para ello tenemos que asignar un significado a las integrales de matrices y a las 




238 Sistemas de ecuaciones diferenciales 

exponenciales de matrices. Por consiguiente, vamos a comentar brevemente el 
cálculo con funciones matriciales. 

7.2 Cálculo con funciones matriciales 

La generalización de los conceptos de integral y derivada para funciones 
matriciales es completamente correcta. Si P(í) = [pi,(í)], defìnimos la integral 
1» PU) dt por 


S* p ( { )dt = [j'piÂt) dt\. 

£sto es, la integral de la matriz P(t) es la matriz obtenida integrando cada elemen- 
to de P(f), suponiendo como es natural, que cada elemento sea integrable en 
[a, b]. E1 lector puede comprobar que la linealidad para las integrales se genera- 
liza a las funciones matriciales. 

La continuidad y derivabilidad de funciones matriciales se definen también 
en función de los elementos. Decimos que una función matricial P = [p,,] es 
continua en t si cada elemento p„- es continuo en t. La derivada P' se defìne deri- 
vando cada elemento 


pv) = ipm, 

siempre que existan todas las derivadas p'a(t). Se comprueban fácilmente las re- 
glas de derivación básicas para sumas y productos. Por ejemplo, si P y Q son 
funciones matriciales derivables, tenemos 

(P + 0' = P' + Q’ 

si P y Q son del mismo tamano, y si el producto PQ está defìnido, tenemos también 
(PQÏ = PQ' + P'Q 

La regla de la cadena también es válida. Esto es, si F(t) = P[g(f)], donde P es 
una función matricial derivable y g es una función escalar derivable, entonces 
F'(t) = g'(í)P'[g(/)]. E1 teorema de la derivada nula, y el primer y segundo teore- 
mas fundamentales del cálculo también son válidos para funciones matriciales. 
Las demostraciones de esas propiedades se proponen en el próximo conjunto de 
ejercicios. 

La defmición de la exponencial de una matriz no es tan sencilla y exige más 
preparación. Tal concepto se expone en la sección que sigue. 
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7.3 Series de matrices. Normas de matrices 

Sea A = ían\ una matriz nX« de elementos reales o complejos. Queremos 
definir la exponencial e' de manera que posea alguna de las propiedades funda- 
mentales de la exponencial ordinaria de valores reales o complejos. En particular, 
exigiremos la ley de exponentes en la forma 

(7.8) e tA e sA = e {t+SÌA para todo par s y t reales, 
y la relación 

(7.9) e° = I, 

donde O e / son las matrices, nXn, cero e identidad respectivamente. Puede pa- 
recer natural definir e* como la matriz [e' 1 "]. No obstante, eso no es aceptable 
porque no satisface ninguna de las propiedades (7.8) o (7.9). En lugar de ello, 
deftniremos e l por medio de un desarrollo en serie de potencias, 



Sabemos que esta fórmula es válida si A es un número real o complejo, y demos- 
traremos que se satisfacen las propiedades (7.8) y (7.9) si A es una matriz. Antes 
necesitamos conocer qué se entiende por serie convergente de matrices. 

DEFINICIÓN DE SERIE CONVERGENTE DE MATRICES. Dada Una SUCeSÌÓn {C*} 

de matrices mXn cuyos elementos son números reales o complejos, designemos el 
elemento ij de Ck por c}*! Si todas las mn series 

(7.10) f (i = 1, ...,m;j= 1. n) 

k=l 

son convergentes, decimos entonces que la serie de matrices 2&Li C* es conver- 
gente, y su suma está definida como la matriz mXn cuyo elemento ij es la serie 

(7.10) . 

Un sencillo y útil criterio de convergencia de una serie de matrices puede 
darse en función de la norma de una matriz, generalización del valor absoluto 
de un número. 

definición de norma de una matriz. Si A = [«,-/] es una matriz mxn 
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de elementos reales o complejos, la norma de A, designada por ||A||, se define 
como el número no negativo dado por la fórmula 

(7.11) MII^ÌÌM- 

Es decir, la norma de A es la suma de los valores absolutos de todos sus 
elementos. Algunas veces se usan otras defìniciones de la norma, pero hemos 
elegido ésta debido a la facilidad con la que podemos demostrar las propiedades 
siguientes. 

TEOREMA 7.1. PROPIEDADES FUNDAMENTALES DE LAS NORMAS. Para las 
matrices rectangulares A y B, y todos los escalares c reales o complejos tenemos 

\\A + B\\ < \\A\\ + , \\AB\\ < \\A\\ ||5||, \\cA\\ = |c| ||A||. 

Demostración. Solamente probamos el resultado para ||AB||, suponiendo que 
A es mXn y B es nXp. Las demostraciones de los otros son sencillas y las deja- 
mos como ejercicios. 

Escribiendo A = [a jt ],B = [&*/],| tenemos AB = [ ^Li ttabt/], así que de 
(7.11) obtenemos 


\\AB\\=H Ì a ikf>ki 

i =1 i= 1 k =1 


<.ìî\^\î\b ki \ ZÎÌM IIBII = Mll IIBII. 


Obsérvese que en el caso especiat B = A la desigualdad para ||AB|| se con- 
vierte en ||A 2 || ^ ||A|| 2 . Por inducción también tenemos 

\\A k \\ <, \\A\\* para k = 1,2,3,.... 


Estas desigualdades se usarán en la discusión de la exponencial de una matriz. 

E1 teorema que sigue nos da una útil condición suficiente para la convergen- 
cia de una serie de matrices. 

TEOREMA 7.2. CRITERIO DE CONVERGENCIA PARA SERIES DE MATRICES. Si 
{Ci} es una'sucesión de matrices mXn tales que ||Ct|| converge, entonces 
la serie de matrices Ck también converge. 1 

Demostración. Designemos el elemento ij de C* por c{*>. Puesto que 
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|c'f | < HCjtll, la convergencia de Xtli IIQil implica la convergencia absoluta de 
cada una de las series 2^1, c]f . Luego cada una de las series T” t cff* es conver- 
gente, por lo que la serie de matrices JíLi C* es convergente. 

7.4 Ejercicios 

1. Comprobar que la linealidad de integrales también es válida para las integrales de fun- 
ciones matriciales. 

2. Comprobar cada una de las siguientes reglas de derivación para funciones matriciales, 
suponiendo que P y Q son derivables. En a), P y Q deben ser del mismo tamano de ma- 
nera que P + Q tenga sentido. En b) y d) no deben ser necesariamente del mismo 
tamano con tal que los productos tengan sentido. En c) y d), Q se supone no singulat. 

a) (P + Qï =P' + Q'. c) (G -1 )' = -Q 'Q'Qr 1 . 

b) (PQ)' = PQ' + P'Q. d) (PQ- 1 )' = -PQ-'Q'Q- 1 + P'Q- 1 . 

3. a) Sea P una función matricial derivable. Demostrar que las derivadas de P 1 y P 3 
vienen dadas por las fórmulas 

( P 2)’ = pp' + p'p (P 3 )' = p*p' + pp'p + p'p *. 

b) Enunciar una fórmula general para la derivada de P k y demostrarla por inducción. 

4. Sean P una función matricial derivable y g una función escalar derivable cuyo recorrido 
sea un subconjunto del dominio de P. Definir la función compuesta F(t) = P[g(/)] y 
demostrar la regla de la cadena, F'(t) = g'(/)P'[g(/)]. 

5. Demostrar el teorema de la derivada nula para funciones matriciales: Si P'(t) = O para 
todo t en un intervalo abierto ( a, b), la función matricial P es constante en (a, b). 

6. Establecer y demostrar generalizaciones del primero y segundo teoremas fundamentales 
del cálculo para funciones matriciales. 

7. Establecer y demostrar una fórmula de integración por partes en la que los integrandos 
sean funciones matriciales. 

8. Demostrar las propiedades siguientes de las normas matriciales: 

U +BII £ \\A II + llfill, \\cA\\ =|c| \\A II. 

9. Si una función matricial P es integrable en un intervalo [a, 6] demostrar que 

||JV/)<*|| £ f b a \\P(t)\\dt. 


10. Sea D una matriz diagonal nXn, D = diag (X t , ... ,X„). Demostrar que la serie matricial 
D k /k ] - converge y es también una matriz diagonal. 


D k 

2<k\ = dia s ( e * 1 . f 


(E1 término correspondiente a A: = 0 se sobreentiende que es la matriz identidad /.) 
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11. Sea D una matriz diagonal nXn, D = diag (Xi,..., X„). Si la serie matricial « c k D' 
converge, demostrar que 

2 c k° k = dia S (Ì c **î> • • • » 2 . 

12. Supongamos que la serie matricial Qconverge, donde cada C k es una matriz nxn. 
Demostrar que la serie matricial y<*> (AC k B) también converge y que su suma es la 
matriz 

"(l c *K 

Aquí A y B son matrices tales que los productos AC k B tienen sentido. 


7.5 Exponencial de una matriz 

Aplicando el teorema 7.2 es fácil demostrar que la serie matricial 


(7.12) 


A* 

k\ 


converge para cualquier matriz cuadrada A con elementos reales o complejos. 
(Se sobreentiende que el término correspondiente a k = 0 es la matriz identi- 
dad /.) La norma de cada uno de los términos satisface la desigualdad 



Puesto que la serie 2 <^/k\ converge para todo número real a, el teorema 7.2 
implica que la serie (7.12) converge para toda matriz cuadrada A. 

definición de exponencial de una matriz. Dada una matriz cualquiera 
A, nXn, con elementos reales o complejos definimos la exponencial e A como la 
matriz nXn dada por la serie convergente (7.12). Esto es. 


f-L k\ 


Obsérvese que esta definición implica e° = I, donde O es la matriz cero. Con 
la ayuda de las ecuaciones diferenciales se estudiarán otras propiedades de la 
exponencial. 
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7.6 Ecuación diferencial que se satisface por e ,A 

Sean t un número real, A una matriz nXn y E(t) la matriz nXn dada por 
E(t) = e tA . 

Mantendremos A fijo y estudiaremos esa matriz como una función de t. Obtenemos 
primero una ecuación diferencial a la que satisfaga E. 

teorema 7.3. Para todo real t la función matricial E definida por E(t) — e tA 
satisface la ecuación diferencial matricial 


E'(t ) = E(t)A = AE(t). 

Demostración. De la defìnición de la exponencial de una matriz tenemos 





Designemos con c j* 1 el elemento ij de A k . Entonces el elemento ij de t k A k /k\ es 
t k c\f/k\. Luego, de la definición de serie matricial, tenemos 


(7.13) 




Cada elemento del segundo miembro en (7.13) es una serie de potencias en t, con- 
vergente para todo t y viene dada por la serie derivada 


y kt k ~ 1 

A k\ 



Esto demuestra que existe la derivada E'(t) y viene dada por la serie matricial 

En la última ecuación utilizamos la propiedad de que i4 t+1 = A k A. Puesto que A 
es permutable con A k podríamos también escribir A k+1 — AA k para obtener la 
relación E'(t) — AE(t). Esto completa la demostración. 


Observación: La demostración anterior pone también en evidencia que A es 
permutable con e ,A . 
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7.7 Teorema de unicidad para la ecuación diferencial matricial F'(t) = AF(t) 

En esta sección demostramos un teorema de unicidad que caracteriza todas 
las soluciones de la ecuación diferencial matricial F\t) = AF(t). La demostración 
utiliza el teorema siguiente. 

teorema 7.4. no singularidad de e tA . Cualesquiera que sean la matriz A, 
nXn, y el escalar t tenemos 

(7.14) e tA e- tA = í. 

Luego e tA es no singular, y su inversa es e~ tA . 

Demostración. Sea F la función matricial definida para todo número real t 
mediante la ecuación 


F(t) = e tA e~ tA . 

Demostraremos que F(t) es la matriz identidad / haciendo ver que la derivada 
F'(í) es la matriz cero. Derivando F como un producto, y recordando el resultado 
del teorema 7.3, encontramos 


F'(0 = e tA (e iA )' + (e lA )'e tA = e tA (—Ae tA ) + Ae tA e~ tA 
= —Ae tA e~ tA + Ae tA e~ tA = O , 

puesto que A es permutable con e tA . Por consiguiente, según el teorema de la 
derivada nula, F es una matriz constante. Pero F(0) = e° A e 0A = /, por lo cual 
F(t) = / para todo t. Esto demuestra (7.14). 

teorema 7.5. teorema de unicidad. Sean A y B dos matrices constantes 
nXn dadas. La única función matricial F, nXn, que satisface el problema de 
valor inicial 


F'(t) = AF(t), F(0) = B 

para — °° < t < + oo es 

(7.15) F(t) = e tA B. 

Demostración. Observemos primero que e tA B es una solución. Sea ahora F 
una solución cualquiera y consideremos la función matricial 


G(t) = e~ iA F(t). 
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Derivando este producto obtenemos 


G\t) = e~ tA F’(t) - Ae~ iA F(t) = e~ tA AF(t) - e~ iA AF(t) = O. 

Por consiguiente G(t) es una matriz constante, 

G(t) = G( 0) = F(0) = B. 

Es decir, e~ tA F(t) = B. Multiplicando por e tA y aplicando (7.14) obtenemos (7.15). 

Observación: E1 mismo tipo de demostración hace ver que F(t) = Be ,A es la 
única solución del problema de valor inicial 

F'(t) = F(t)A, F(0)=B. 

7.8 Ley de exponentes para exponenciales de matrices 

La ley de exponentes e^e 3 = e A+B no siempre es válida para exponenciales de 
matrices. En el ejercicio 13 de la sección 7.12 se da un contraejemplo. No obstante, 
no es difícil demostrar que la fórmula es válida para matrices permutables. 

teorema 7.6. Sean A y B dos matrices «X« permutables, AB = BA. Te- 
nemos 

(7.16) = eV*. 

Demostración. De la ecuación AB = BA deducimos que 

A 2 B = A(BA) = (AB)A = (BA)A = BA\ 

de modo que B es permutable con A 2 . Por inducción, B es permutable con cual- 
quier potencia de A. Escribiendo e ,A en forma de serie de potencias encontramos 
que B también es permutable con e tA para todo t real. 

Sea ahora F la función matricial defmida por la ecuación 

F(t) = e HA +B> - e tA e tB . 

Derivando F(t) y teniendo en cuenta que B es permutable con e tA encontramos 

F'(t) = (A + B)e tlA+B) - Ae tA e tB - e tA Be tB 

= (A + B)e HA+B) ~(A + B)e tA e tB = (A + B)F(t). 
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Según el teorema de unicidad tenemos 

F(t) = e tlA+B) F( 0). 

Pero F(0) = O, así que F(t) = O para todo t. Luego 

e UA + B ) _ e iA e tB 


Cuando t = 1 obtenemos (7.16). 

ejemplo . Las matrices s/1 y tA son permutables para todos los escalares 
s y t. Luego tenemos 


e sA e tA = e u+t)A . 


7.9 Teoremas de existencia y unicidad para sistemas lineales homogéneos con 
coeficientes constantes 

La ecuación diferencial vectorial Y'(t) = AY(t), donde A es una matriz 
constante nXn eY e s una función vectorial n-dimensional (considerada como una 
matriz columna nXl) se denomina sistema lineal homogéneo con coeficientes 
constantes. Utilizaremos la exponencial de una matriz para dar una fórmula explí- 
cita de la solución de un tal sistema. 

teorema 7.7. Sean A una matriz constante nXn dada y B un vector n-di- 
mensional. El problema de valor inicial 

(7.17) Y’(t) = A Y(t ), 7(0) = B , 

tiene solución única en el intervalo — «> < t < + oo. Esta solución viene dada 
por la fórmula 

(7.18) Y(t) = e tA B. 

Más general, la única soluctón del problema de valor inicial 
Y'(t) = AY(t), Y(a) = B , 


<?s Y(t) = e ( ‘^ Á B. 


Demostración. La derivación de (7.18) nos da Y'(t) = Ae tA B = AY(t). Pues- 
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to que 7(0) = B, ésta es una solución del problema de valor inicial (7.17). 

Para demostrar que es la única solución, razonamos como en la demostración 
del teorema 7.5. Sea Z(t) otra función vectorial que satisfaga Z'(t ) = AZ(t) con 
Z(0) = B, y pongamos G(t) = e~ iA Z(t). Comprobamos entonces con facilidad que 
G'(t) = O, así que G(t) = G( 0) = Z(0) = B. Es decir, e~ tA Z(t) = B, de modo 
que Z(t) = e tA B = Y(t). Del mismo modo se puede discutir el caso más general 
con valor inicial Y(a) = B. 

7.10 E1 problema de calcular e ,A 

Aunque el teorema 7.7 da una fórmula explícita para la solución de un siste- 
na homogéneo con coeficientes constantes, queda todavía el problema de calcular 
efectivamente la exponencial e tA . Si se tratara de calcular e tA directamente a 
partir de la definición de serie tendríamos que calcular todas las potencias A k 
para k = 0, 1,2 ,..., y calcular luego la suma de cada serie t k c)f /k\, donde 
c es el elemento ij de A k . En general ése es un trabajo desesperante salvo si A 
es una matriz cuyas potencias pueden calcularse fácilmente. Por ejemplo, si 
A es una matriz diagonal, sea 

A = diag (Aj,... , A„), 

entonces toda potencia de A también es una matriz diagonal, pues 
A k = diag (X k ,..., k k ). 

Por consiguiente en este caso e tA es una matriz diagonal dada por 

e tA = diag A «) = diag(e Ul . e u ”). 

Otro caso fácil de manejar es cuando A es una matriz que puede diagona- 
nizarse. Por ejemplo, si existe una no singular C tal que C~ l AC es una matriz dia- 
gonal, sea C _1 AC = D, entonces tenemos A = CDC~', a partir de la cual encon- 
tramos 


A 2 = (CDC-^iCDC- 1 ) = CD 2 C ~ k , 


y, más general, 


A k = CD k C~ x . 
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Por tanto en este caso tenemos 


*-> k\ ^k\ 


Aquí la dificultad está en determinar C y su inversa. Una vez ésas son conocidas, 
e tA se calcula con facilidad. Naturalmente, no toda matriz puede diagonalizarse 
de modo que la utilidad de las observaciones precedentes es limitada. 

ejemplo 1. Calcular e tA para la matriz 2x2, A — 

Solución. Esta matriz tiene autovaiores distintos A* = 6, X 2 = 1, así que 



Multiplicando las matrices, encontramos que esa ecuación se satisface cualesquiera 
que sean los escalares a, b, c, d tales que a = 4c, b = — d. Tomando c = d = 1 
elegimos 



l|"4 — llT e u e 8t l i T4e 6í + e‘ 4e 6t — 4e t_ | 

5 Ll 1J L — e* 4e‘J 5L e 6t — e* e^ + ^e'J 

ejemplo 2. Resolver el sistema lineal 

yí = 5^1 + 4y 2 
yi = yi + 2y 2 

sujeto a las condiciones iniciales y t (0) = 2, y 2 (0) = 3. 
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Solución. En forma matricial el sistema se puede escribir así: 

Y’(t) = A Y(t), Y( 0) = , donde A = 

Según el teorema 7.7 la solución es Y(t) = e í l Y(0). Usando la matriz e tA calcula- 
da en el ejemplo 1 encontramos 

[>,] _ lf 4é>6í + e* 4e 6t - 4e f ~| f 2l 

Ly 2 J 5 L e 6t - e* e 6t + 4e f J L3J 

de la que obtenemos 

ji = 4e 6t — 2e f , j 2 = e 6f + 2e f . 

Se conocen muchos métodos para calcular e ,A cuando + no puede diagona- 
lizarse. La mayoría de ellos son más bien complicados y exigen transformaciones 
matriciales previas, cuya naturaleza depende de las multiplicidades de los auto- 
valores de A. Más adelante discutiremos un método práctico y seguro para calcular 
e tA que se puede utilizar tanto si A puede diagonalizarse como si no. Es válido 
para todas las matrices A y no exige transformaciones previas de ningún tipo. 
Tal método fue desarrollado por E. J. Putzer en un artículo del American 
Mathematical Monthly, Vol. 73 (1966), págs. 2-7. Se basa en un famoso teorema 
atribuido a Arthur Cayley (1821-1895) y William Rowan Hamilton (1805-1865; 
que establece que toda matriz cuadrada salisface su ecuación característica. De- 
mostraremos primero el teorema de Cayley-Hamilton y luego lo aplicaremos para 
obtener la fórmula de Putzer para calcular e tA . 

7.11 Teorema de Cayley-Hamilton 

teorema 7.8. teorema de cayley-ham i lton. Sean A una matriz nXn y 

(7.19) /(*) = det (XI - A) = X n + c^X"- 1 + • • • + c x X + c 0 

su polinomìo característico. Entonces f(A) = O. Es decir, A satisface la ecuación 

(7.20) A n + c^A”- 1 + • • • + Cl A + c 0 I = O. 

Demostración. La demostración se basa en el teorema 3.12 que establece 
que para toda matriz cuadrada A se tiene 



(7.21) 


+ (cof A) 1 = (det A)I. 
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Apliquemos esta fórmula reemplazando A por XI — A. Puesto que det (XI — A) = 
=/(A), la ecuación (7.21) se convierte en 

(7.22) (XI - y4){cof (XI - A)}‘ = f(X)I. 

Esta ecuación es válida para todo real A. La idea de la demostración consiste en 
hacer ver que también es válida cuando A se reemplaza por A. 

Los elementos de la matriz cof (XI — A) son los cofactores de XI — A. Excep- 
to para un factor ± 1, cada uno de tales cofactores es el determinante de una 
menor de XI — A de orden n — 1. Por lo tanto cada elemento de cof (XI — A), 
y por tanto de {cof (XI — A)} ( , es un polinomio en A de grado <. n — 1. Por 
consiguiente 


{cof (XI - A)Y = '£x k B k , 

k =0 

donde cada coeficiente B k es una matriz nXn con elementos escalares. Aplicando 
esto en (7.22) obtenemos la relación 

(7.23) (A/ - A)£ X k B k = f(X)I 
que se puede poner en la forma 

(7.24) X n B n _ k +£x\B k _ , - AB k ) - AB 0 = X n I +£x k c k I + c 0 I. 


Igualando ahora los coeficientes de las potencias semejantes de A en (7.24) obte- 
nemos las ecuaciones 


(7.25) 


B n -i = / 

B n _ 2 - AB n _ k = c n _J 

B 0 - AB X = cj 
—AB 0 = c 0 I. 


La igualación de los coeficientes es posible porque (7.24) es equivalente a n 2 
ecuaciones escalares, en cada una de las cuales podemos igualar los coeficientes 
de potencias semejantes de A. Multipliquemos a continuación las ecuaciones (7.25) 
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sucesivamente por A n , A " l ,..., A, I y sumemos los resultados. Los términos del 
primer miembro desaparecen y obtenemos 

0 = A n + c n _ 1 A n ~ 1 +■■ ■ + Cl A + c 0 /. 

lo cual demuestra el teorema de Cayley-Hamilton. 


Observación: Hamilton demostró el teorema en 1853 para un tipo especial de 
matrices. Pocos aiios más tarde, Cayley anunció que el teorema era válido para 
todas las matrices, pero no dio la demostració" 


ejemplo. La matriz A 


r5 4 0' 


12 0 tiene como polinomio característico 


.1 2 2. 


/(2) = (A — 1)(A - 2)(2 - 6) = 2* - 92 2 + 202 - 12. 


E1 teorema de Cayley-Hamilton establece que A satisface la ecuación 
(7.26) A a - 9A 2 + 20 A -12 1=0. 

Esta ecuación puede usarse para expresar A 3 y todas las potencias superiores de 
+ en función de /, + y A 2 . Por ejemplo, tenemos 

A 3 = 9+ 2 - 2041 + 12/, 

A 4 = 9 A 3 - 20A 2 + 12+ = 9(9 A 3 - 20+ + 12/) - 20+ 2 + 12+ 

= 61+ 2 - 168+ + 108/. 

También se puede emplear para expresar A~ 2 como un polinomio en +. De (7.26) 
resulta también A(A 2 — 9A + 20/) = 12/, y obtenemos 

+-» = í 2 (A 3 - 9+ + 20/). 


7.12 Ejercicios 


En cada 


de los ejercicios del 1 al 4, a) expresar A', A 1 y todas las potencias supe- 
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riores de A como combinaciones lineales de I y A. (E1 teorema de Cayley-Hamilton puede 
servir de ayuda). b) Calcular e‘ Á . 

'■ -c:} —c 3- —n- -r::} 

r 0 1] r cos / sen /1 

5. a) Si A = , demostrar que e tA = 

L-1 OJ l-sen i cosfj 

b) Hallar la fórmula correspondiente para e' A cuando / 
t- ll 

6. Si F(t) =1 ^ .demostrar que e Fl,) — eF(e , ~ 1 ). 


7. Si A(t) es una función escalar de t, la derivada de e iín es e A " ) A'(t). Calcular la derivada 


de e‘“’ cuando 4(/) = 


.[* '1 

0 Oj 


y demostrar que el resultado no es igual a ninguno de los 


dos productos e 1 “ > A'(í) o i4'(f)e 4 “ ) . 

En cada uno de los ejercicios 8, 9, 10, a) calcular A", y expresar A 1 en función de 
I,A,A 2 . b) Calcular e‘ A . 



’o i r 


‘o i r 


'2. 0 0' 

8. A = 

0 0 1 

0 0 0 

ro -i 

9. A = 

°1 

0 1 1 

0 0 0 

10. .4 = 

0 1 0 

0 1 1 


,expresar e‘ A como combinación lineal de 1, A, A 2 . 



'0 1 ori 

'x 2 

xy 

f 

12. Si /1 = 

2 0 2 demostrar que e A = 


*+f 

2xy 


0 i oj 


xy 

* 2 _ 


, donde x = cosh. 1 e 

y = senh 1 


13. Este ejemplo demuestra que la ecuaciòn e A+R = e A e B no siempre es válida para las 
exponenciales de matrices. Calcular cada una de las matrices e A e B , e B e A . e A+B cuando 
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n -n 

, y observar que los tres resultados son distintos. 


7.13 Método de Putzer para calcular e ,A 

E1 teorema de Cayley-Hamilton demuestra que la potencia n-ésima de cual- 
quier matriz A, nXn, puede expresarse como combinación lineal de las potencias 
inferiores l,A,A 2 ,.. . De aquí resulta que cada una de las potencias su- 

periores A n '\ A n+2 ,.... también puede expresarse como combinación lineal de 
I, A,A 2 ,..., A n_1 . Por lo tanto, en la serie que define e ,A , cada término t k A k /k\ 
con k ^ n es una combinación lineal de t k I, t k A, t k A',. . . , t k A n ~ l . Luego cabe pen- 
sar que e tA puede expresarse como un polinomio en A de la forma 

(7.27) e’ A = q k {t)A k , 

k = 0 

donde los coeficientes escalares qAt) dependen de t. Putzer desarrolló dos métodos 
útiles para expresar e ,A como un polinomio en A. E1 teorema que sigue describe 
el más sencillo de los dos métodos. 

teorema 7.9. Sean Ài,... los autovalores de una matriz A, nXn, y 
definamos una sucesión de polinomios en A como sigue: 

(7.28) P 0 (A) = 1, P k (A ) = f\ (A - XJ), para k = l,2,...,n. 

Tenemos entonces 

(7.29) e ‘ A ~ 2 r *+i( í )7 > j;(^), 



donde los coeficientes escalares r,(t ),.... r n (t) se determinan por recurrencia a 
partir del sistema de ecuaciones diferenciales lineales. 


(7.30) 1W 

4+t(0 = 4+i r *+i(0 + r k (t), r k+1 ( 0) = 0, (k= 1,2. n-í). 

Observación: La ecuación (7.29) no expresa e ,Á directamente en potencias 
de A como indica (1.21), sino como una combinación lineal de los polinomios 
PáA) ,P,(A ),... ,P n -,(A). Estos polinomios se calculan fácilmente en cuanto se 
han determinado los autovalores de A. Asimismo son de fácil cálculo los multipli- 
cadores r,(t),..., r„(t) de (7.30). Aunque esto exige resolver un sistema de ecuacio- 
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nes diferenciales lineales, el sistema que nos ocupa tiene una matriz triangular y 
las soluciones pueden determinarse en forma sucesiva. 

Demostración. Sean n(t), .. ■ ,r n (t) las funciones escalares determinadas por 

(7.30) y definamos una función matricial F por inducción 

(7.31) 

Obsérvese que F(0) = ri(0)P o (A) = /. Demostraremos que F(í) = e ,A probando 
que F satisface la misma ecuación diferencial que e tA , es decir, F'(t) = AF(t). 
Derivando (7.31) y usando las fórmulas de recurrencia (7.30) obtenemos 

m = lr', +l (t)P k (A) =|V t (í) + k k+1 r k+1 (t)}PÂA), 

donde r 0 (t) es por definición 0. Volvemos a escribir esa fórmula en la forma 

F'(0 =2 ^(OP^A) + 2 Vifn-iíO PM), 

k =0 *=0 

restamos luego X n F(t) = 2”~ ò Kr k+ x(t)P k (A) para obtener la relación 

(7.32) F'(t) - X n F(t) = Ir k+1 (t){P k+1 (A) + (K + i ~ K)PM)} ■ 

k =0 

Pero de (7.28) vemos que Pk +1 (A) = (A — ^ k+1 I)P k (A), por lo que 

P k+ i(A) + (K+i ~ K)Pk(A) = (A- K + J)Pk(A) + (K+i ~ K)P k (A) 

= (A- X n l)Pk(A). 

Por consiguiente la ecuación (7.32) se convierte en 

F'(0 - KF(t) = (A — Kl)J.r k + 1 (t)P k (Á) = (A- Kl){F(t) - rJtjP^A)} 

= (A-Kl)F(t)- r n (t)P n (A). 

E1 teorema de Cayley-Hamilton implica que P„(A) = O, así que la última ecua- 
ción se convierte en 


F'(t) - KF(0 =(A- KI)F(t) = AF(t) - KF(t), 




Método de Putzer para calcular e tA 255 

de la que resulta F\t) = AF(t). Puesto que F(0) = /, el teorema de unicidad (7.7) 
demuestra que F(t) = e tA . 

ejemplo 1. Expresar e tA como combinación lineal de / y de A si A es una 
matriz 2X2 con sus autovalores iguales a A. 

Solución. Poniendo A, = A 2 = A, tenemos que resolver el sistema de ecua- 
ciones diferenciales 


^(0 = ^(0, r t(0) = i, 

r&t) = Ar.(í) + rj(í), r 2 (0) = 0. 

Resolviendo esas ecuaciones de primer orden en forma sucesiva encontramos 
rÁt) = e xt , r 2 (t) = te u . 

Puesto que P n (A) = I y P^(A) = A — XI, la fórmula pedida para e tA es 

(7.33) e tA = e xt I + te u (A - XI) = e"(l - Xt)I + te x, A. 

ejemplo 2. Resolver el ejemplo 1 si los autovalores de A son A y ju, tales 
que A # fi. 

Solución. En este caso el sistema de ecuaciones diferenciales es 

rí(t) = X ri (t), r x (0) = 1, 

r í(t) = pr 2 (t) + ri (t ), r 2 (0) = 0. 

Sus soluciones vienen dadas por 

rÁt) = e xt , r 2 (t) = . 

X — p 

Puesto que P„(A) = I y P,(A) = A — XI la fórmula pedida para e tA es 

(7.34) é A = e xt I + eX * ~ ** (A - XI) = ^ ^ I + ^ A. 

A — fl X — p X — fl 


Si los autovalores A y /i son números complejos, las exponenciales e xt y 
también lo serán. Pero si A y /x son complejos conjugados las expresiones que mul- 
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tiplican / y A en (7.34) serán reales. Por ejemplo, supongamos 

X= <*. + ip, n = a. — ifì, /3 jí 0. 

Entonces X — p. = 2i(3 así que la ecuación (7.34) se transforma en 

Jx+ifiH Ja-ifiH 

e>A = e< * +wt i + —— R — iA - («+ m 

2 ip 

= + — 2ijì (A — oíI — ifil) J 

= «“*|(cos pt + i sen fit)I + (A - a/ - i/3/)j . 

Los términos que contienen i desaparecen y queda 


(7.35) 


- {(/5 cos fSt — asen fìt)I + sen /3/ A }. 


7.14 Otros métodos para calcular e' A en casos especiales 

E1 método de Putzer para expresar e tA como un polinomio en A es completa- 
mente general debido a que es válido para todas las matrices cuadradas A. Un 
método general no siempre es el más sencillo en ciertos casos particulares. En esta 
sección damos métodos más sencillos para calcular e ,A en tres casos especiales: 
a) Cuando todos los autovalores de A son iguales, b) cuando todos los autovalores 
de A son distintos, y c) cuando A tiene dos autoválores distintos y uno de ellos 
precisamente de multiplicidad 1. 

teorema 7.10. Si A es una matriz nXn con todos sus autovalores iguales 
a X, entonces tenemos 

(7.36) J A = e"2£(A - 2If. 

Demostración. Puesto que las matrices Xtl y t(A — XI) son permutables 
tenemos 
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E1 teorema de Cayley-Hamilton implica que (A — A I) k = O para todo k ^ n, así 
que el teorema queda demostrado. 

teorema 7.11. Si A es una matriz nX« con n autovalores distintos 
K ,Kt • • - ,K, entonces tenemos 

e tA = 2 e u *L k (A), 

k=l 

donde Lk(A ) es un polinomio de grado n — 1 dado por la fórmula 
L k (A) = JJ ^para k = 1, 2,..., n. 

í=i X* — Á } 

Observación: Los polinomios L,(A) se llaman coeficientes de interpolación de 
Lagrange. 

Demostración. Defìnamos una función matricial F por la ecuación 

(7.37) F(t) =îe^L k (A) 

y comprobemos que F satisface la ecuación diferencial F'(t) = AF(t ) y la condi- 
ción inicial F(0) = I. De (7.37) vemos que 

AF(t) - F'(t) =îe iX *(A - WÁA). 

Según el teorema de Cayley-Hamilton tenemos (A — \ k I)L k (A) = O para cada k, 
de modo que F satisface la ecuación diferencial F(t) = AF(t). 

Para completar la demostración necesitamos probar que F satisface la con- 
dición inicial F(0) = I, que se convierte en 

(7.38) 2L k (A) = l. 

En el ejercicio 16 de la sección 7.15 se esboza una demostración de (7.38). 

E1 teorema que sigue trata el caso en el que A tiene dos autovalores distin- 
tos, uno de los cuales tiene precisamente multiplicidad 1. 

teorema 7.12. Sea A una matriz nXn (n > 3) con dos autovalores disiin- 
tos \ y P, tales que A tiene multiplicidad n — 1 y p. tiene multiplicidad 1. Tenemos 
entonces 
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10«-A)"- 1 {p-Xr'^H 


- X)k \ {A - xirl ' 


Demostración. Como en el caso del teorema 7.10 empezamos escribiendo 


“2£ n - Uf - Zf,(A - Uf + e“$£(A- U)‘ 


- *" 1« M ~ 1,)l+ **| VrV 

Calculemos ahora en forma finita la serie con índice r del segundo término del se- 
gundo miembro mediante el teorema de Cayley-Hamilton. Puesto que 


A — fil = A — XI — {u — X)I 

encontramos 

(A - XI) n ~ 1 (A - pl) =(A- Xiy -(p- X)(A - Xiy- 1 . 


E1 primer miembro es O en virtud del teorema de Cayley-Hamilton así que 
(A - Xiy = (ju- X)(A - XI )”- 1 . 

Usando esta relación reiteradamente llegamos a 

(A - XI) n ~ 1+r = (n~ X) r (A - XI)^ 1 . 

Por consiguiente la serie con índice r se convierte en 

S („ í 1 + r)! & - J )'< + - ")- = 0.-V'V - J) ‘ (+ - i, )""‘ 

Esto completa la demostración. 

La fórmula explícita del teorema 7.12 puede deducirse también aplicando el 
método de Putzer, pero los detalles son más complicados. 

Las fórmulas explícitas de los teoremas 7.10, 7.11 y 7.12 sirven para todas 
las matrices de orden n ^ 3. Puesto que el caso 3X3 es frecuente en la práctica, 
resumimos a continuación las fórmulas para mayor facilidad en su utilización. 
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CASO I. Si una matriz A, 3X3, tiene autovalores A., A, A, entonces 


e tA = e u {I + t(A - XI) + \t\A - XI) 2 }. 

CASO II. Si una matriz +, 3X3, tiene autovalores A, n, v, entonces 


e <A = (A-pl)(A-vI) e „ t (A - XI)(A - vl) gVt (A - XI)(A - pl) 

(X — p)(X — v) (p — X)(p — v) (v — X)(v — /ì) 

CASO III. Si una matriz A, 3X3, tiene autovalores A, A, n, siendo 
A #/x, entonces 


= e u {I + t(A - XI)} + *- -£- (A - XI) 2 - -JíL (A - XI) 2 . 

(/í - A ) 2 p- X 


ejemplo. Calcular e tA cuando + = 


'0 1 0 ' 
0 0 1 
2 -5 4 


Soluciótt. Los autovalores de + son 1, 1, 2, así que la fórmula dellcasojlll 
nos da 


(7.39) e tA = e‘{I + t(A - /)} + (e 2t - e‘)(A - I) 2 - te\A - I) 2 . 


Haciendo operaciones y ordenando obtenemos 

(7.40), e tA = (-2te * + e 2t )I + {(3í + 2)e* - 2e 2t }A - {(t + l)e‘ - e 2t }A 2 . 

Ahora ya podemos calcular (A — I) 2 o A 2 y efectuar las operaciones indicadas 
en (7.39) o (7.40) para escribir el resultado como una matriz 3X3. 


e tA = 


' —2te* + e 2i 

-2 (t + l)e ( + 2e 2t 
—2(t + 2)e ( + 4e 2í 


(3/ + 2)e‘ - 2e 2< 
(3/ + 5)e* - 4e 2i 
(3 1 + 8)e‘ - 8e 2i 


~(t + l)e‘ + e 2< " 
~(t + 2y + 2e 2t 
-(t + 4)e‘ + 4e 2< _ 
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7.15 Ejercicios 

Para cada una de las matrices de los ejercicios 1 al 6, expresar e ,A como un polinomio 


'5 -2] f 1 2 

1. A = 2. A = 

4-1 2-1 


1 0 2' 
0 1 3 
0 0 1 


-6 -11 


5. A = 


1 -1 


6 . ^ = 


110 0 ‘ 
0 2 10 
0 0 3 0 
0 0 0 4. 


7. a) Se sabe que una matriz /4,3X3, tiene todos sus autovalores iguales a X. Demos- 
trar que 

e tA - 2Xt + 2)1 + (-22/2 + 2t)A + / 2 + 2 }. 


b) Encontrar una fórmula análoga si + es una matriz 4x4 con todos sus autovalores 
iguales a X. 

En cada uno de los ejercicios del 8 al 15, resolver el sistema Y' — AY sujeto a la con- 
dición inicial dada. 



1 2 1 






r -5 3" 1 


r 

11 



8. A = 


Y( 0) 

= . 


9 

A = 

, E(0) 

= 

. 




l_2 -U 



L^J 



L-15 7j 


L 

u 




'3 -1 

r 




r 


'2 0 0' 



' Cl 


10. A = 

2 0 

i 


Y(0) = 

- 

i 

11. A = 

0 1 0 

, Y( 0) = 

c 2 



1 -1 

2 




2_ 


0 1 1 



_c 3 . 



r 0 1 


0' 



V 


-2 2 

-3" 



'8' 

12. A = 

0 0 


1 

, Y(0) 

= 

0 

13. A = 

2 1 

-6 

,E(0) 

= 

0 


-6 -11 


" 6 . 



0 


-1 -2 




0 


14. A = 

'110 0' 

0 2 10 


0' 

0 


'0 0 2 0' 

10 0 2 


0 

0 0 3 0 
_0 0 0 4j 

, Y(0) = 

.1. 

15. A = 

0 0 0 4 

0 0 1 oj 

, E(0) = 

2 

_1_ 
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16. Este ejercicio esboza una demostración de la ecuación (7.38) utilizada en la demostración 
del teorema 7.11. Sea Lt(\) el polinomio en X de grado n — 1 definido mediante 


L k w = j7 

i*k 


X 

7 


_ 

- h' 


donde X,,..., X, son n escalares distintos, 

a) Demostrar que 


L k (X t ) 




*i = h- 


b) Sean yi,...,y», n escalares arbitrarios, y sea 


P(h = Ỳy k L k (X). 


Demostrar que p(X) es el único polinomio de grado < n — 1 que satisface las n ecua- 
ciones 


p(h) = y k P ara k = 1,2,...,«. 

c) Demostrar que^" =1 Z,t(X) = 1 para todo X, y deducir.que para toda matriz cuadrada 
A tenemos 

ỲL k (A) = /, 

donde I es la matriz identidad. 


7.16 Sistemas lineales no homogéneos con coeficientes constantes 

A continuación consideramos el problema de valor inicial no homogéneo 

(7.41) Y'(t) = A Y(t) + 0(0, Y(a) = B, 

en un intervalo /. A es una matriz constante nXn, Q es una función vectorial 
n-dimensional (considerado como una matriz nXl) continua en /, y a es un 
punto dado en /. Podemos obtener una fórmula explícita para la solución de este 
problema siguiendo el mismo proceso que en el caso escalar. 
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Multiplicamos primero ambos miembros de (7.41) por la exponencial matri- 
cial e~ tA y pongamos la ecuación diferencial en la forma 

(7.42) e~ iA {Y'(t) - A Y(í)} = e~ tA Q(t). 

E1 primer miembro de (7.42) es la oc.ivada del producto e~ iA Y(t). Por consi- 
guiente, si integramos ambos miembros de (7.42) entre a y x. donde x e J, ob- 
tenemos 


e~ xA Y(x) - e~ aA Y(a) = J" e~ iA Q(t) dt. 


Multiplicando por e* A obtenemos la fórmula explícita (7.43) que aparece en el 
teorema siguiente. 

teorema 7.13. Sean A una matriz constante nXn y Q una función vectorial 
n-dimensional continua en un intervalo /. Entonces el problema de valor inicial 

Y'(t) = AY(t) + Q(t), Y(a) = B, 
tiene una solución única en J dada por la fórmula explícita 
(7.43) y(x) = e ix ~ a)A B + e xA j* e~ iA Q(t) dt. 

Como en el caso homogéneo, la dificultad al aplicar esta fórmula en los casos 
prácticos radica e'n el cálculo de las exponenciales de matrices. 

Obsérvese que el primer término, es la solución del problema ho- 

mogéneo Y'(t) = AY(t), Y(di = B. E1 segundo término es la solución del pro- 
blema no homogéneo 


Y'(t) = AY(t) + Q(t), Y(à) = 0. 


Ilustramos el teorema 7.13 con 'un ejemplo. 
ejemplo. Resolver el problema de valor inicial 


Y’(t) = AY(t)+Q(t), 7(0) = B, 
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en el intervalo (— oo, + oo )„ donde 


'2 -i r 


"e 2í " 


'0' 

0 3-1 

, 6(0 = 

0 

, B = 

0 

2 1 3 




_0_ 


Solución. De acuerdo con el teorema 7.13, la solución viene dada por 
(7.44) y(x) = e xA J" e~ tÂ Q(t) dt = J" e ,x ~ tìA Q(t) dt. 


Los autovalores de A son 2, 2 y 4. Para calcular e xA utilizamos la fórmula del 
caso III, sección 7.14, obteniendo 

e xA = e ix {I + x(A - 21)} + \(e ix - e 2x )(A - 2 I? - A xe 2x (A - 21? 

= e 2 *{/*+ x(A - 21) + }(e 2x - 2x - Í)(A - 21?}. 

Podemos reemplazar x por x — t en esta fórmula para obtener e (x ~ i)A . Por con- 
siguiente el integrando en (7.44) es 


e ( *- tìA Q(t) = e 2ix ~ tì {I + (x - t)(A - 21) + - 2(x -()-!](/!- 2I?}Q(t) 


1 

Oj + (A - 21)e 2x \ 
Integrando, encontramos 


x - t 
0 

Áx - 0- 


r x 

X 


}x 2 

y(x) = 1 e (x ~ tìA Q(t) dt = e 2x 

0 

+ (A - 2/)e 2 *J 

0 


Ux 2 J 


Jx 3 _ 


e 2x e~ 2t - 2(x - t) - 1 
0 

e 2x te~ 2t - 2 t(x -t)-t. 


ìe 2 * -}-x-x 2 
0 

Lie*“ - i - ìx - Jx 2 - | 


Puesto que tenemos 


A — 21 = 

'o -i r 

0 1 -1 

y - 2i? = 

' 2 

-2 

0 2' 

0 -2 


2 1 1 


2 

0 2_ 
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encontramos 



’ X 


' W | 


- | e sx fx 2 - ix 3 ~ 

Y(x) = e 2a: 

0 

>1 

+ e ìx 

-Ix 3 

X 2 + ix a _ 

+ 

-ìe^ + | + %x + íx* + }x a 

ie* - § - ìx - ìx* - }x a _ 


■ fc» - f + fcc _ **■- 

— fc 2 * + I + ÌX + fx 2 
|e M - f - f* + f* 2 . 


Las íìlas de esta matriz son las funcicnes pedidas y u y 2 , y 3 . 

7.17 Ejercicios 

1. Sea Z una solución del sistema no homogéneo 

Z'(t) = AZ(t) + Q(t), 

en un intervalo / con valor inicial Z(a). Demostrar que existe una sola solución del 
sistema homogéneo 


Y'(t) — A Y(t) + Q(t) 

en / con valor inicial Y(a) y que viene dado por la fórmula 
Y(t) = Z(t) + Y(a) - Z(a )}. 

A menudo se dispone de otros métodos para determinar una solución particular 
Z(t) que asemeja a la función dada Q(f). Los ejercicios 2, 3, 5, y 7 indican tales mé- 
todos para Q(t) = C, Q(t) = e al C, Q(t) = t m C, y Q(t) = (cos ott)C + (sen at)D, donde 
C y D son vectores constantes. Si la solución particular así obtenida Z(t) no tiene el 
valor inicial pedido, modificamos Z(t) como se indica en el ejercicio 1 para obtener otra 
solución Y(t) con el valor inicial exigido. 

2. a) Sea A una matriz constante nXn, B y C sean vectores constantes n-dimensionales. 
Demostrar que la solución del sistema 

Y'(t) = AY(t) + C, Y(a) = B, 

en (— co, +oo) viene dada por la fórmula 


Y(x) = + (j* a e uA d«)c. 
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b) Si A es no singular, demostrar que la integral del apartado a) tiene el valor 

{e U--a)A _ I}A -K 

c) Calcular Y(x) en forma explícita cuando 



3. Sean A una matriz constante «Xn, y B y C vectores constantes n-dimensionales, y sea a 
un escalar dado. 

a) Demostrar que el sistema no homogéneo Z'(t) — AZ(t) + e at C tiene una solución 
de la forma Z(t) = e at B si, y sólo si, (al — A)B = C. 

b) Si a no es un autovalor de +, demostrar que el vector B siempre se puede elegir 
de modo que el sistema del apartado a) tenga una solución de la forma Z(t) = e at B . 

c) Si a no es un autovalor de +, demostrar que toda solución del sistema 
Y'(t) = + Y(t) + <**C tiene la forma Y(t) = e tA (Y( 0 ) — B) + e xt B, donde B = (a/ — 
- Ay'C. 

4. Utilizar el método sugerido por el ejercicio 3 para hallar una solución del sistema no 
homogéneo Y’(t) = + Y(t) + e n C con 



5. Sean A una matriz constante nXn, B y C vectores constantes n-dimensionales, y m 
un entero positivo. 

a) Demostrar que el sistema no homogéneo Y'(t) = AY(t) + t m C, y(0) = B, tiene una 
solución particular de la forma 

Y(t) = B 0 + tB t + t 2 B 2 + ■ • • + t m B m , 
en donde Bo, B t ,..., B m son vectores constantes, si y sólo si 

C = A m+1 B. 

Determinar los coeficientes B 0 ,B,,..., B„ para una tal solución. 

b) Si A es no singular, demostrar que el vector inicial B siempre puede elegirse de ma- 
nera que el sistema del apartado a) tenga una solución de la forma indicada. 

6. Considérese el sistema no homogéneo 

X =3^ +J2 +í 3 
X = + 2+2 + t 3 . 

a) Encontrar una solución particular de la forma Y(t) = B 0 + tB, + t 2 B, + BB,. 

b) Encontrar una solución del sistema con la condición yi(0) = y 2 (0) = 1 . 

7. Sean A una matriz constante nxn, B,C,D vectores constantes n-dimensionales y a un 
número real no nulo dado. Demostrar que el sistema no homogéneo 


Y’(t) = AY(t) + (cos a.t)C + (sena t)D, 


Y( 0) = B, 
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tiene una solución particular de la forma 

Y(t) = (cos at)E + (sena t)F, 
siendo E y F vectores constantes, si y sólo si 

(A 2 + <x 2 l)B = -(AC + aD). 

Determinar E y F en función de A,B,C para una tal solución. Obsérvese que si 
A 2 + al es no singular, el vector. inicial B siempre se puede elegir de modo que el sis- 
tema tenga una solución de la forma indicada. 

8. a) Hallar una solución particular del sistema no homogéneo 

y'i=yi+ 3 y 2 + 4sen 2t 

y’ì =yi-y*- 

b) Hallar una solución del sistema con las condiciones y t (0) = y 2 (0) = 1. 

En cada uno de los ejercicios 9 al 12, resolver el sistema no homogéneo 
Y'(t) = AY(t) + Q(t) sujeto a la condición inicial indicada. 



7.18 Sistema lineal general Y'(t) = P(í)y(í) + Q(t) 

E1 teorema 7.13 da una fórmula explícita para la solución del sistema lineal 


Y'(t) = AY(t)+ Q(t), Y(a) = B, 
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donde A es una matriz constante nxn y <3(0, Y(t) son matrices columna nXl- 
Volvemos ahora al caso más general 

(7.45) Y'(t) = P(t) Y(t) + (2(0, Y(a) = B, 

en donde la matriz P(t), nXn, no es necesariamente constante. 

Si P y Q son continuas en un intervalo abierto /, un teorema general de exis- 
tencia y unicidad que demostraremos más adelante nos dice que para cada a de / 
y cada vector inicial B existe una sola solución para el problema de valor inicial 

(7.45) . En esta sección utilizamos este resultado para obtener una fórmula para 
la solución, que generaliza el teorema 7.13. 

En el caso escalar (n = 1) la ecuación diferencial (7.45) puede resolverse 
del modo siguiente. Sea A(x) = /* P(t)dt, multipliquemos entonces ambos miembros 
de (7.45) por e~ A(t) poniendo la ecuación diferencial en la forma 

(7.46) e~ Mtì {Y’(t) - P(t)Y(t)} = e~ M) Q(t). 

E1 primer miembro es la derivada del producto e~ A(t) Y(t). Por consiguiente, po- 
demos integrar ambos miembros entre a y x, siendo a y x puntos de /, y obte- 
nemos 


e- Mx) Y(x) - e~ A(aì Y(a) = f‘ e~ Mtì Q(t) dt. 

Multiplicando por e A(x) se llega a la fórmula explícita 

(7.47) Y(x) = e^^e-^.Y^á) + J* e~ A(t) Q(t) dt. 

La única parte de este razonamiento que no es aplicable a las funciones ma- 
triciales es la afìrmación de que el primer miembro de (7.46) es la derivada del 
producto e~ A(t) Y(t). En este punto utilizamos el hecho de que la derivada de 
e~ A(t) es —P(t)e~ A(t) . En el caso escalar esto es una consecuencia de la fórmula 
siguiente para la derivación de las funciones exponenciales 

Si E(t) = e Mt) , entonces E'(t) = A’(t)e A(i) . 

Desgraciadamente, esta fórmula de derivación no siempre es válida cuando A es 
una función matricial. Por ejemplo, es falsa para la función matricial 2X2 

n n 

A(t) = (Ver ejercicio 7 de la sección 7.12). Por tanto es necesario una 

Lo oj 
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modificación del razonamiento para extender la ecuación (7.47) al caso de las 
matrices. 

Supongamos que multiplicamos cada miembro de (7.45) por una matriz 
F(t), nXn, no especificada. Esto nos da la relación 

F(t)Y'(t) = F(t)P(t)Y(t) + F(t)Q(t). 

Sumemos ahora a los dos miembros F'(t)Y(t) con la idea de transformar el primer 
miembro en la derivada del producto F(t)Y(t). Si hacemos esto, la última ecua- 
ción nos da 


{F(t)Y(t)V = (F’(t) + F(t)P(t)}Y(t) + F(t)Q(t). 

Si podemos elegir la matriz F(t) de manera que la suma {F'(t) + F(t)P(t)} del se- 
gundo miembro sea la matriz cero, la última ecuación se simplifica y queda 

{E(í)y(t)}' = F(t)Q(t). 

Integrando ésta desde a a x obtenemos 

F(x)Y(x) - F(a)Y(a) = /’ F(t)Q(t) dt. 

Si, además, la matriz F(x) es no singular, obtenemos la fórmula explícita 

(7.48) Y(x) = E(x) _1 F(a) Y(a) + F(x) -1 /“ F(t)Q(t) dt. 

Ésta es una generalización de la fórmula escalar (7.47). E1 proceso funcionará 
bien si podemos encontrar una función matricial F(t), nXn, que satisfaga ia ecua- 
ción diferencial matricial 


F'(t) = —F(t)P(t) 


y que no sea singular. 

Obsérvese que esta ecuación diferencial es muy parecida a la ecuación dife- 
rencial original (7.45) con Q(t) = 0, salvo que la función incógnita F(t) es una 
matriz cuadrada en lugar de una matriz columna. Asimismo, la función incógnita 
está multiplicada a la derecha por —P(t) en lugar de estarlo a la izquierda por 
P(t). 

Seguidamente demostraremos que la ecuación diferencial para F siempre 
tiene una solución no singular. La demostración dependerá del siguiente teorema 
de existencia para sistemas lineales homogéneos. 
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teorema 7.14. Supongamos que A(t) es una función matricial nXn con- 
tinua en un intervalo abierto J. Si a e J y B es un vector n-dimensional dado, el 
sistema lineal homogéneo 

Y'(t) = A(t)Y(t), Y(a) = B, 

tiene en J una solución Y que es un vector n-dimensional 

En la sección 7.21 damos una demostración de este teorema. Con la ayuda 
de éste podemos demostrar el siguiente. 

teorema 7.15. Dada una función matricial P, nXn, continua en un inter- 
valo abierto J, y dado un punto cualquiera a en J, existe una función matricial F, 
nXn, que satisface la ecuación diferencial matricial 

(7.49) F’(x) = -F(x)P(x) 

en J con el valor inicial F(a) = I. Además, F(x) es no singular para cada x en J. 
Demostración. Sea Y*(x) una solución vectorial de la ecuación diferencial 
YL (*) = ~P(x)%(x) 

en / con vector inicial Y*(a) = /*, donde h es la columna k de la matriz identi- 
dad /, nXn. Aquí P(x)‘ representa la transpuesta de P(x). Sea G(x) la matriz 
nXn cuya columna k es Y k (x). Entonces G satisface la ecuación diferencial ma- 
tricial 

(7.50) G'(x) = -P( x yG(x) 

en / con valor inicial G(a) = /. Tomemos ahora la transpuesta de cada miembro 
de (7.50). Puesto que la transpuesta de un producto es el producto de las trans- 
puestas en orden invertido, obtenemos 

{G'W}‘ = -G(xyp(x). 

También, la transpuesta de la derivada G' es la derivada de la transpuesta G*. 
Por tanto la matriz F(x) = G(x)‘ satisface la ecuación diferencial (7.49) con 
valor inicial F(a) = /. 

Demostremos ahora que F(x) es no singular construyendo su inversa. Sea H 
la función matricial nXn cuya columna k es la solución de la ecuación diferencial' 


Y'(x) = P(x)Y(x) 
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con valor inicial Y(a) = h, la columna k de /. Entonces H satisface el problema 
de valor inicial 


H'(x) = P(x)H(x), H(a) = /, 

en /. E1 producto F(x)H(x) tiene derivada 

F(x)H'(x) + F'(x)H(x) = F(x)P(x)H(x) - F(x)P(x)H(x) = O 

para cada x de /. Por consiguiente el producto F(x)H(x) es constante, F(x)H(x) = 
= F(a)H(a) = I, así que H(x) es la inversa de F(x). Esto completa la demos- 
tración. 

En el teorema que sigue quedan resumidos los resultados de esta sección. 

teorema 7.16. Dadas una función matricial P, nXn, y una función vec- 
torial n-dimensional Q, ambas contínuas en un intervalo abierto J, la solución del 
problema de valor inicial 

(7.51) Y'(x) = P(x) Y(x) + Q(x) , F(a) = B, 

en J viene dado por la fórmula 

(7.52) Y(x) = F(x)~ 1 Y(a) + F(x)- 1 J' F(t)Q(t) dt . 

La matriz F(x), nXn, es la transpuesta de la matriz cuya columna k es la solución 
del problema de valor inicial 

(7.53) Y'(x) = -P(xy Y(x), Y(a) = I k , 

en donde h es la columna k de la matriz identidad /. 

Aunque el teorema 7.16 proporciona una fórmula explícita para la resolución 
del sistema lineal general (7.51), tal fórmula no siempre resulta útil para calcular 
la solución debido a la dificultad que supone la determinación de la función ma- 
tricial F. Ello exige la solución de n sistemas lineales homogéneos (7.53). En la 
siguiente sección se expone un método con series de potencias que a veces se 
emplea en la resolución de sistemas lineales homogéneos. 

Una vez más recordamos al lector que la demostración del teorema 7.16 se 
basó en el teorema de existencia 7.14, para los sistemas lineales homogéneos, que 
todavía no hemos demostrado. 
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7.19 Resolución de sistemas lineales homogéneos mediante serìes de potencias 

Consideremos un sistema lineal homogéneo 
(7-54) Y'(x) = A(x)Y(x), Y( 0) = B, 

en el que la matriz A, nXn, dada tiene un desarrollo en serie de potencias de x 
convergente en un cierto intervalo abierto que contenga el origen, tal como 

A(x) = A 0 + xAi + x*A 2 + • • ■ + x k A k + ... , para |x| < r k , 

donde los coeficientes A n , A-i, A 2 ,... son matrices nXn dadas. Intentemos encon- 
trar una serie de potencias solución de la forma 

Y(x) = B 0 + xB k + x 2 B 2 + • • • + x k B k + •••, 

con los vectores B 0 , Bx, B 2 ,... como coeficientes. Puesto que y(0) = B 0 , la con 
dición inicial se satisfará tomando B 0 = B, el vector inicial prescrito. Para deter- 
minar los coeficientes restantes sustituimos la serie de potencias que da Y(x) en 
Ia ecuación diferencial e igualamos los coeficientes de potencias semejantes de x 
obteniendo el siguiente sistema de ecuaciones 

(7.55) B k = A 0 B, (k + 1 )B k+1 = , para k = 1,2 . 

r=0 

Estas ecuaciones pueden resolverse en torma sucesiva respecto a los vectores 
Bi, B 2 ,.... Si la serie de potencias de Y(x) que resulta converge en un cierto 
intervalo |x| < r 2) entonces Y(x) será una solución del problema de valor inicial 
(7.54) en el intervalo \x\ < r, siendo r = min{ri,r 2 }. 

Por ejemplo, si A(x) es una matriz constante A, entonces A 0 = A y A k — O 
para k ^ 1, así que el sistema de ecuaciones (7.55) se convierte en 

B k = AB, (k + l)B i+1 = AB k para k > 1. 

Resolviendo esas ecuaciones sucesivamente encontramos 

B k = A k B para k> 1. 

Por tanto en este caso la serie solución toma la forma 

y(x) = B + 2 A k B = e xA B. 
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Esto está de acuerdo con el resultado obtenido antes para los sistemas lineales 
homogéneos con coeficientes constantes. 

7.20 Ejercicios 


1. Sean p una función de valores reales y Q una función matricial nxi, ambas continuas 
en un intervalo /. Sea A una matriz constante nXn. Demostrar que el problema de 
valor inicial 


Y'(x) = p(x)A Y(x) +Q(x), Y(a) = B, 

tiene la solución 

= e« ix)A B + e« lxìA j x e-« U)A Q(t) dt 


en /, donde q(x) = f x p(t)dt. 

2. Considerar el caso particular del ejercicio 1 en el que A sea no singular, a— 0, p(x)=2x, 
y Q(x) = xC, Siendo C un vector constante. Demostrar que la solución se convierte en 

y(x) = e x * A (B + iA-'C) - ÌA-'C. 

3. Sean A(t) una función matricial nXn y E(t) = e*"’. Sean Q(f), y(f) y B matrices 
columna wxl. Supongamos que 


E(t) = A'(t)E(t) 

en un intervalo abierto /. Si a e / y si A' y Q son continuas en /, demostrar que el 
problema de valor inicial 

Y'(t) = A'(t) Y(t) + Q(t), Y(a) = B, 

tiene la siguiente solución en /; 

Y(x) = e Alx) e- Aia) B + e A(x) j* e~ AU) Q(t) dt. 

4. Sea E(t) = e 4 “’. Este ejercicio muestra ejemplos de funciones matriciales A(t) para las 
que E'(t) = A'(t)E(t). 

a) Que sea A(t) = t'A, donde A es una matriz constante nxn y r un entero positivo. 
Demostrar que E'(t) = A'(t)E(t) en (—<»,+00). 

b) Sea A(t) un polinomio en f con matrices como coeficientes 


A(t) =%t r A r , 
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siendo los coeficientes permutables A,A, = A,A, para todos los r y s. Demostrar que 
E'(t)=A'(t)E{t ) en (—,+«>). 
c) Resolver el sistema lineal homogéneo 

Y'(t ) = (/ + tA) Y(t), y(0) = 5 

en el intervalo (—00, oc), donde + es una matríz constante nxn. 

5. Supongamos que la función matricial, »X«, A(x) admite un desarrollo en serie de po- 
tencias convergente para )jc| < r. Desarrollar un procedimiento para resolver, mediante 
desarrollo en serie, el siguiente sistema lineal homogéneo de segundo orden: 

Y"(x) = A(x)Y(x), con K(0) = B, î"(0) = C. 


6. Considerar el sistema de segundo orden Y"(x) + AY(x) = 0, con y(0) = B, y'(0) = C 
donde A es una matriz constante nXn. Demostrar que el sistema tiene la serie de po- 
tencias solución 


Y(x) 




(- 1 ) k x ìk+1 A k \ 
(2k + 1)! ) 


C 


convergente para — < x < + °° . 


7.21 Demostración del teorema de existencia por el método de las aproximaciones 
sucesivas 

En esta sección demostramos la existencia y unicidad de una solución para 
cualquier sistema lineal homogéneo 

(7.56) Y'(t) = A(t)Y(t), 

donde A(t) es una función matricial nXn, continua en un intervalo abierto /. 
Demostraremos que para un punto cualquiera a de / y cualquier vector inicial B 
existe exactamente una solución Y(t) en / que satisface la condición inicial 
Y(a) = B. 

Usaremos el método de aproximaciones sucesivas, que es un método iterativo 
aplicable también a otros muchos problemas. Fue publicado primero por Liouville 
en 1838 en conexión con el estudio de las ecuaciones diferenciales lineales de se- 
gundo orden. Más tarde fue extendido por J. Caqué en 1864, L. Fuchs en 1870, 
y G. Peano en 1888 al estudio de las ecuaciones lineales de orden n. En 1890 
Émile Picard (1856-1941) extendió el método al abarcar también las ecuaciones 
diferenciales no lineales. En reconocimiento a su contribución fundamental, al- 
gunos autores lo citan como el método de Picard. E1 interés del método no es 
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sólo teórico sino que también se usa en algunos casos para obtener las aproxima- 
ciones numéricas de las soluciones. 

E1 método empieza tomando una supuesta solución de la ecuación (7.56). 
Tomamos como tal el vector inicial dado B, si bien esto no es esencial. Sustituimos 
entonces esta supuesta solución en el segundo miembro de la ecuación y obtene- 
mos una nueva ecuación diferencial 

no = a(ob. 

‘En esta ecuación el segundo miembro ya no contiene la función incógnita, así 
que la ecuación puede resolverse inmediatamente integrando ambos miembros 
entre a y x, siendo x un punto arbitrario de /. Esta ecuación tiene exactamente 
una solución Yi en / que satisface la condición inicial Y^a) — B , o sea 

Y 1 (x) = B + j* A(t)Bdt. 

Reemplazamos ahora Y(t) por YJt) en el segundo miembro de la ecuación 
diferencial original (7.56) obteniendo una nueva ecuación diferencial 

Y'(t) = A( 0^(0. 

Esta ecuación tiene una sola solución Y 2 en / con la condición Y 2 (a) = B, 

(7.57) y 2 (x) = B + J“ >1(0Ei(0 dt. 

Sustituimos entonces Y 2 en el segundo miembro de (7.56) y resolvemos la ecuación 
resultante para determinar Y 3 con Y 3 (a) = B, y así sucesivamente. Este proceso 
engendra una sucesión de funciones Y„, Y u Y 2 ,..., en la que Y„ = B y donde 
Yk+i se determina a partir de Yk mediante la fórmula de recurrencia 

(7.58) Y k+1 (x) = B + j* A(t)Y k (t) dt para fc = 0,1,2,.... 

Nuestro objetivo es demostrar que la sucesión de funciones así defìnida con- 
verge hacia una función límite Y que es una solución de la ecuación diferencial 
(7.56) en / y que también satisface la condición inicial Y(a) = B. Las funciones 
Y n , y„y 2 ,... se llaman aproximaciones sucesivas de Y. Antes de estudiar la con- 
vergencia del proceso ilustramos el método con un ejemplo. 

ejemplo. Consideremos el problema de valor m\cìa\ Y'(t) = AY(t), Y(0) = B , 
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donde A es una matriz constante nXn. Sabemos que la solución está dada por la 
fórmula Y(x) = e xA B para todo x real. Demostraremos cómo esta solución se 
puede obtener por el método de las aproximaciones sucesivas. 

La hipótesis inicial es Y 0 (x) = B. La fórmula de recurrencia (7.58) nos da 

Yi(x) = B + j*ABdt = B + xAB, 

Y 2 (x) = B + j’ AY k (t) dt = B + j* ( AB + tA 2 B) dt = B + xAB + ±x 2 A 2 B. 
Por inducción encontramos 

Y*(x) = B + xAB + $x 2 A 2 B + •••+! x k A k B = • 

La suma del segundo miembro es una suma'parcial de la serie de e xA . Por consi- 
guiente cuando k -> <x> encontramos 

lim Y k (x) = e xA B 

para todo x. Así pues, en este ejemplo podemos demostrár directamente que las 
aproximaciones sucesivas convergen hacia una solución del problema de valor ini- 
cial en (-«, +oo). 

Demostración de la convergencia de la sucesión de îas aproximaciones suce- 
sivas. Volvamos ahora a la sucesión general definida por la fórmula de recurren- 
cia (7.58). Para demostrar que la sucesión converge escribimos cada término 
Yk(x) cómo una suma telescópica. 


(7.59) 


Y k (x) = Y 0 (x) +ï{Y m+1 (x) - YJx)}. 


Para demostrar que Y*(x) tiende hacia un límite cuando k °° demostraremos 
que la serie 

(7.60) fjì'm+iM - 

converge para cada x de /. A tal fin basta demostrar que la serie 
î o \\Y m+1 (x) - Y n (x)\\ 


(7.61) 
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converge. En esta serie utilizamos el concepto de norma de una matriz introducido 
en la secdón 7.3; la norma de una matriz es la suma de los valores absolutos de 
todos sus términos. 

Consideremos un subintervalo acotado y cerrado /i de / que contenga a. 
Demostraremos que para todo x de /i la serie (7.61) es mayorada por una serie 
convergente de constantes independientes de x. Esto implica que la serie conver- 
ge uniformemente en J t . 

Para hacer una estimación de la magnitud de los términos de (7.61) utiliza- 
mos repetidamente la fórmula de recurrencia. Inicialmente, tenemos 

Ei(x) - y 0 (x) = J“ A(t)B dt. 

Para mayor sencillez, supongamos que a < x. Entonces podemos escribir 

(7.62) || Yi(x) - y 0 (x)|| = | /' A(t)B dt || < J" M(í)|| \\B\\ dt . 

Puesto que cada elemento de A(t) es función continua en /, cada elemento 
está acotado en el intervalo cerrado acotado /i. Por consiguiente ||A(0|| - M, 
donde M es la suma de las cotas de todos los elementos de A(t) en el intervalo 
/i. (E1 número M depende de / a .) Por consiguiente el integrando de (7.62) está 
acotado por !|6||M, así que tenemos 

llì'i(x) ~ Y 0 (x)\\ <. /" ||B|| M dt = ||B|| M(x - a) 

para todo x > a en Ji. 

Utilicemos ahora la fórmula de recurrencia una vez más para expresar la 
diferencia Y 2 — Y^ en función de Yi — Y 0 , y luego empleamos la estimación que 
acabamos de obtener parà Yi — Y 0> y se deduce 

\\Y 2 (x) - Y 1 (x)|| = || /' AÍOÍY^í) - Y 0 (í)} dt || < /" ||A(0|| || B || M(t - a) dt 

<, ||B|| M 2 /" (f -a)dt= ||B|| — (X ~ a)ì 
° 2 ! 

para todo x > a en / x . Por inducción encontramos 

II Y n+1 (x) - Y m (x)|| < ||B|| Mm+1(x ~ g)W+1 para m = 0, 1, 2. 

(m + 1)! 

y para todo x > a de /i. Si x < a un razonamiento parecido da la misma desigual- 
dad con \x — a\ en lugar de (x — a). Si designamos con L la longitud del intervalo 
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/,, entonces tenemos \x — a\ L para todo x de / a así que obtenemos la acotación 

II W x ) — *’’«(*) II < l|B|| para m = 0,1 , 2,.. . 

(m + 1)! 

para todo x de /,. Por consiguiente la serie de (7.61) es mayorada por la serie 
convergente 


1,1 

Esto demuestra que la serie (7.61) converge uniformemente en /i. 

E1 razonamiento anterior demuestra que la sucesión de aproximaciones suce- 
sivas siempre converge y en /, la convergencia es uniforme. Sea Y la función 
límite. Esto es, definimos Y(x) para cada x en /, por 

Y(x) = lim Y k (x). 

Demostraremos que Y tiene las propiedades siguientes: 

a) Y es continua en /,. 

b) Y(x) = B + A(t) Y(t) dt para todo x de /,. 

c) Y(a) = B e Y’(x) = A(x) V(x) para todo x de /j. 

La parte c) demuestra que Y es una solución del problema de valor inicial en } x . 

Demostración de a). Cada función Yk es una matriz columna cuyos ele- 
mentos son funciones escalares, continuas en /,. Cada elemento de la función 
límite Y es el límite de una sucesión uniformemente convergente de funciones 
continuas, así que, según el teorema 11.1 del volumen I, cada elemento de Y es 
también continua en /,. Por consiguiente Y es continua en /,. 

Demostración de b). La fórmula de recurrencia (7.58) establece que 
Y k+ i(x) = B + j“ A(t)Y k (t) dt . 

Por consiguiente 

Y(x) = Hm Y* +1 (x) = B + lim /* A(t)Y k (t) dt = B + J* A(t) lim Y k (t) dt 
= B + /" A(t)Y(t) dt. 

E1 intercambio del símbolo de límite con el signo integral es válido por la con- 
vergencia uniforme de la sucesión { Y k } en / a . 
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Demostración de c). La ecuación Y(a) = B rèsulta al momento de b). De- 
bido al apartado a), el integrando de b) es continuo en /, así que, en virtud del 
primer teorema fundamental del cálculo, Y'(x) existe y es igual a A(x) Y(x) en /,. 

E1 intervalo /, sabemos que es un subintervalo cualquiera de / cerrado y 
acotado y que contenga a. Si /, se amplía, el proceso para obtener Y(x) no varía 
porque sólo incluye la integración de a a x. Puesto que para todo x d e / existe 
un subintervalo de / cerrado y acotado y que contiene a y x, existe una solución 
en todo el intervalo /. 

TEOREMA 7.17. TEOREMA DE UNICIDAD PARA SISTEMAS LINEALES HOMOGÉ- 
neos . Si A(t) es continua en un intervalo abierto J, la ecuación diferencial 

Y(t) = A(t)Y(t) 

tiene a lo más una solución en / que satisface una condición inicial dada Y(a)=B. 

Demostración. Sean Z e Y dos soluciones en /. Sea /, cualquier subinter- 
valo de / acotado y cerrado que contenga a. Demostraremos que Z(x) = Y(x) 
para todo x en /,. Esto implica que Z = Y e n todo el intervalo /.' 

Puesto que Z e Y son soluciones tenemos 

Z’(t)~ Y’(t) = A(t){Z(t) — Y(t)}. 

Elijamos x en /, e integremos esta ecuación entre a y x con lo que obtenemos 

Z(x) - Y(x) = f* A(t){Z(t) - E(t)} dt. 

Ésta implica la desigualdad 

(7.63) l|Z(x) - y(x)|| < M | /; ||Z(í) - E(0I| dt | , 

donde M es una cota superior de || >4(0:1! en /,. Sea M, una cota superior para 
la función continua ||Z(í) - y(0|| en /,. Entonces la desigualdad (7.63) nos da 

(7.64) ||Z(x) - y(x)|| < MM, \x-a\. 

Aplicando (7.64) en el segundo miembro de (7.63) obtenemos 

||Z(x) - y(x)|| < m 2 m , | /; |t - a \ dt | = m 2 m x ^ ~ . 
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Por inducción resulta 

(7.65) l|Z(x) - P(x)|| < M m M 1 í ? ~ a r. 

Cuando m -> » el segundo miembro tiende a 0, así que Z(x) = Y(x). Esto com- 
pleta la demostración. 

Los resultados de esta sección pueden resumirse en el siguiente teorema de 
existencia y unicidad. 

teorema 7.18. Sea A una función mairicial nXn continua en un intervalo 
abierto f. Si a e } y B es un vector n-dimensional cualquiera, el sistema lineal ho- 
mogéneo 


Y'(t) = A(t)Y(t), Y(a) = B, 

tiene una y sólo una solución que es un vector n-dimensional en }. 

7.22 Aplicación del método de aproximaciones sucesivas a Ios sistemas no linea- 
les de primer orden. 

E1 método de aproximaciones sucesivas también puede aplicarse a algunos 
sistemas no lineales. Consideremos un sistema de primer orden de la forma 

(7.66) Y' = F(t, Y), 

donde F es una función vectorial n-dimensional dada, e Y es una función vecto- 
rial n-dimensional incógnita que hay que determinar. Queremos una solución Y 
que satisfaga la ecuación 


Y'(t) = F[t, Y(t)] 

para cada t en un cierto intervalo / y que también satisfaga una condición inicial 
dada, por ejemplo Y(a) = B, donde a e / y B es un vector n-dimensional dado. 

A1 igual que en el caso lineal, construimos una sucesión de aproximaciones 
sucesivas Y„, Y u Y 2 .... tomando Y„ = B y definiendo Y k+1 en función de Y k 
mediante la fórmula de recurrencia 

(7.67) Y k+1 (x) = B + /* F[t, Y k (t)] dt para k = 0, 1, 2. 

Imponiendo ciertas condiciones a F, esta sucesión convergerá hacia una función 
límite Y que satisfará la ecuación diferencial y la condición inicial dadas. 
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Antes de averiguar la convergencia del proceso vamos a discutir algunos 
ejemplos unidimensionales elegidos para ilustrar algunas de las dificultades que 
pueden presentarse en la práctica. 

ejemplo 1. Consideremos el problema de valor inicial no lineal ý = x 2 + y 2 
con y = 0 cuando x = 0. Calcularemos algunas aproximaciones de la solución. 
Elijamos Y„(x) = 0 y determinaremos las tres siguientes aproximaciones como 
sigue: 


Y(x) = = 

™ = J>' + mì * - + 9 * - f + 5 ■ 
^=j:[' i+ (f + â>'=f + 5 + ^ + i£- 


Ahora se ve el enorme trabajo que será necesario para calcular más aproximacio- 
nes. Por ejemplo, las dos aproximaciones siguientes Y 4 e Y 5 serán polinomios 
de grados 31 y 63, respectivamente. 

E1 próximo ejemplo muestra otra dificultad que puede presentarse en el 
cálculo de las aproximaciones sucesivas. 

ejemplo 2. Consideremos el problema, de valor inicial, no lineal / = 2x + 
+ e v , con y = 0 cuando x = 0. Comenzamos con la función inicial Y 0 (x) = 0 
y encontramos 


Yi(x) = /* (2 1 + 1 )dt = x 2 + x, 

Y 2 (x). = /* (2 1 + e‘* +í ) dt = x 2 + J* e‘ ,+< dt. 

Aquí, no se puede seguir adelante por el hecho de que la última integral no puede 
calcularse como expresión de funciones elementales. No obstante, para una x dada 
es posible calcular una aproximación numérica de la integral y con ello se obtiene 
una aproximación de Y 2 (x). 

A causa de las dificultades que hemos visto en los dos últimos ejemplos, el 
método de aproximaciones sucesivas en la práctica no es el más útil para la deter- 
minación explícita de soluciones. E1 auténtico valor del método consiste en su 
empleo para establecer teoremas de existencia. 
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7.23 Demostración de un teorema de existencia y unicidad para sistemas no 
lineales de primer orden 

Volvamos ahora al teorema de existencia y unicidad para sistemas no lineales 
de primer orden. Imponiendo restricciones adecuadas a la función que aparece 
en el segundo miembro de la ecuación diferencial 


Y' = F(x, Y), 


podemos extender el método de demostración usado en el caso lineal de la sec- 
ción 7.21. 

Sea / el intervalo abierto en el que deseamos una solución. Supongamos que 
a e J y que B es un vector n-dimensional dado. Designemos con S un conjunto 
en el espacio de dimensión (n + 1) dado por 

S = {(x,Y)\ \x-a\ <h, ||r-5|| <,k}, 

donde h > 0 y k > 0. [Si n = 1, es un rectángulo con centro en (a, B), con base 
2 h y altura 2k.] Supongamos que el dominio de F incluye un conjunto S de este 
tipo y que F es acotada en S, sea 

(7.68) II F(x, Y)\\<,M 

para todo punto (x, Y) de S, siendo M una constante positiva. 

Seguidamente, supongamos que la función compuesta G(x) = F(x, Y(x)) es 
continua en el intervalo (a - h,a + h) para toda función Y que sea conti- 
nua en (a — h, a + h) y que tenga la propiedad de que (x, Y(x)) e S para 
todo x en (a — h, a + h). Esta hipótesis asegura la existencia de las integrales 
que se presentan en el método de aproximaciones sucesivas, e implica tambicn 
la continuidad de las funciones así construidas. 

Finalmente, supongamos que F satisface una condición de la forma 

Wx, Y)-F(x,Z)\\<,A\\Y-Z\\ 

para todo par de puntos (x, Y) y (x, Z) de S, siendo + una constante positiva. 
Ésta se llama una condición de Lipschitz en honor de Rudolph Lipschitz, que fue 
el primero en introducirla en 1876. Una tal condición no es un restricción muy 
seria para una función y nos permite extender la demostración de la existencia 
y unicidad del caso lineal al no lineal. 

TEOREMA 7.19. EXISTENCIA Y UNICIDAD DE LAS SOLUCIONES DE SISTEMAS NO 

lineales de primer orden. Supongamos que F satisface la acotación, la conti- 
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nuidad y las condiciones de Lipschitz antes citadas en un conjunto S. Sea I el 
intervalo abierto {a — c, a + c), donde c = min {h, k/M}. Existe entonces una 
y sólo una función Y definida en I, siendo Y(a) = B, tal que (x, Y(x)) e S y 

Y'(x) = F(x, F(x)) para cada x de I. 

Demostración. Puesto que la demostración es análoga a la del caso lineal 
indicamos solamente los principales pasos. Pongamos y„(x) = B y definamos las 
funciones vectoriales Y u Y 2 ,... en / mediante la fórmula de recurrencia 

(7.69) Y m+1 (x) = B + J’ F[t, YJt)] dt para m = 0, 1, 2. 

Parr. que la fórmula de recurrencia tenga sentido necesitamos saber si (x, y m (x)) 
e S para cada x de I. Esto se demuestra fácilmente por inducción en m. Cuando 
m — 0 tenemos ( x, y,,(x)) = (x, B), que está en S. Supongamos entonces que 
(x, Y m (x )) e S para unmy cada x de I. Utilizando (7.69) y (7.68) obtenemos 

II Y m+1 (x) - B\\ < | /; ||F[f, y m (f)]|| dt | ^ M | /; dt | = M |x - a\. 

Puesto que \x — a\ ^ c para x en /, esto implica que 
l\Y m+1 (x)-B\\£Mc<k, 

lo cual demuestra que (x, Y m+1 (x)) e S para cada x en /. Por consiguiente la 
fórmula de recurrencia tiene sentido para todo m>0y toda x de I. 

La convergencia de la sucesión {y m (x)} se establece ahora exactamente como 
en la sección 7.21. Escribamos 

YÁx) - y 0 (x) + lV m+1 (x) - y m (x)} 

y demostremos que Yk(x) tiende hacia un límite cuando k °° demostrando que 
la serie 


2 fl ll Y m+1 (x) - y m (x)|| 

converge en /. Esto se deduce de la desigualdad 

l|y m+1 (x)--y m (x)n 


(m + 1)! 


(m + 1)! 
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que se demuestra por inducción, usando la fórmula de recurrencia y la condición 
de Lipschitz. Definimos entonces la función límite Y por 

y(x) = lim Y m (x) 

para cada x de / y comprobamos que satisface la ecuación integral 
Y(x) = B + f*F[t, Y(t)] dt, 

exactamente como en el caso lineal. Esto demuestra la existencia de una solución. 
La unicidad puede entonces demostrarse por el mismo método utilizado para de- 
mostrar el teorema 7.17. 

7.24 Ejercicios 


1. Considerar el problema lineal de valor inicial 


y' + y = 26* , con; y — 1 cuando x = 0 . 


a) Hallar la solución exacta Y de este problema. 

b) Aplicar el método de aproximaciones sucesivas, partiendo de la función inicial 

Ydx) = 1 . 

Determinar Y„(x) explícitamente y demostrar que 
lim Y n (x) = Y(x) 


para todo x real. 

2. Aplicar el método de aproximaciones sucesivas al problema de valor inicial no lineal 

y' = x + ý 2 , con, y = 0 cuando x = 0. 

Tomar Y 0 (x) = 0 como función inicial y calcular V 3 (x). 

3. Aplicar el método de aproximaciones sucesivas al problema de valor inicial no lineal 

y' = 1 + xý', con y = 0 cuando x = 0. 

Tomar Y 0 (x) = 0 como función inicial y calcular V 3 (x). 

4. Aplicar el método de aproximaciones sucesivas al problema de valor inicial no lineal 

y' = x 2 + y 2 , con y = 0 cuando x = 0. 
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Partir de la «mala» función inicial yoW = 1, calcular Yì(x), y comparar con los resul- 
tados del ejemplo 1 de la sección 7.22. 

5. Considerar el problema de valor inicial no lineal 


y' = x 2 + y 2 , con y = 1 cuando x = 0. 

a) Aplicar el método de aproximaciones sucesivas, partiendo de la función inicial 
Yo(x) = 1, y calcular Y 2 (x). 

b) Sea R = [ — 1,1] X [ —1,1] . Hallar el menor M tal que \f(x, y)| < M en R. Hallar 
un intervalo / = ( — c, c) tal que la gráfica de toda función aproximante Y„ en I, esté 
en R. 

c) Supóngase que la solución y = Y(x) tiene un desarrollo en serie de potencias en un 
entorno del origen. Determinar los seis primeros términos no nulos de ese desarrollo y 
comparar el resultado con el del apartado a). 

6. Considerar el problema de valcr inicial 


y' = 1 + y 2 , con y = 0 cuando x — 0. 

a) Aplicar el método de aproximaciones sucesivas, partiendo de la función inicial 
y»(x) = 0, y calcular Y,(x). 

b) Demostrar que toda función aproximante Y„ está definida en todo el eje real. 

c) Utilizar el teorema 7.19 para demostrar que el problema de valor inicial tiene por 
lo menos una solución en cualquier intervalo de la forma (—h,h). 

d) Resolver la ecuación diferencial por separación de variables y demostrar así que 
existe una sola solución Y del problema de valor inicial en el intervalo (—ir/2,vr/2) y 
ninguna en un intervalo más amplio. En este ejemplo, Ias aproximaciones sucesivas están 
defmidas en todo el eje real, pero convergen hacia una función límite únicamente en 
el intervalo (-ir/2, ir/ 2). 

7. Busquemos dos funciones y = y(x) y z = Z(x) que satisfagan simultáneamente el sis- 
tema de ecuaciones 


y' =z, z' = + z) 

con las condiciones iniciales y = 1 y z =1/2 cuando x — 0. Comenzar con las fun- 
ciones iniciales yo(x) = 1, Zo(x) = 1/2, y emplear el método de aproximaciones sucesi- 
vas para obtener las funciones aproximantes 


y 3 W = ì 


f 3x* 

2 + 40 + 60 + 192 ’ 
8 + 10 + 64 + 36Ô 


8. Considerar el sistema de ecuaciones 
y' = 2x + z. 


= 3 xy + x 2 z. 
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con valores iniciales y = 2 y z = 0 cuando x = 0. Partir de las funciones iniciales 
7o(x) = 2, Zo(x) = 0, y con el método de aproximaciones sucesivas determinar Yj(x) 
y Z,(x). 

9. Considerar el problema de valor inicial 


y’= x 2 y'+ x*y, con y = 5 e y'= 1 cuandox=0. 


Cambiar este problema en otro equivalente que incluya un sistema de dos ecuaciones 
con dos funciones incógnitas y = Y(x) y z = Z(x), siendo z = y'. Aplicar entonces el 
método de aproximaciones sucesivas, partiendo de las funciones iniciales Ya(x) = 5 y 
Z 0 (x) = 1, y determinar y 3 (x) y Z,(x). 

10. Sea / una función definida en el rectángulo R = [ — 1,1] X [ — 1,1] del modo siguiente: 


K*>y) = 



sí x = 0, 
si x ^ 0 
Si X *0 


Si x 



a) Demostrar que | f(x, y)| < 2 para todo (x, y) de R. 

b) Demostrar que / no satisface una condición de Lipschitz en R. 

c) Para cada constante C que cumple |C| < 1, demostrar que y = Cx 1 es una solución 

del problema de valor inicial y' = f(x, y), con y = 0 cuando x = 0. Demostrar que la 

gráfìca de cada una de esas soluciones en ( — 1,1) está en R. 

d) Aplicar el método de aproximaciones sucesivas al problema de valor inicial, par- 
tiendo de Yt(x) = 0. Determinar Y„(x) y demostrar que las aproximaciones convergen 
hacia una solución del problema en el intervalo (—1,1). 

e) Repetir la parte d), partiendo de Yo(x) = x. Determinar Y„(x) y demostrar que las 
funciones aproximantes convergen hacia una solución diferente de cualquiera de las 
del apartado c). 

f) Repetir la parte d), partiendo de Yo(x) = x 5 . 

g) Repetir la parte d), partiendo de yo(x) = x 1 / 3 . 


* 7.25 Aproximaciones sucesivas y puntos fijos de operadores 

La idea básica del método de aproximaciones sucesivas puede usarse no sólo 
para establecer teoremas de existencia para ecuaciones diferenciales sino también 
para otros muchos problemas del análisis. E1 resto de este capítulo reformula el 
citado método en una forma que amplía mucho el alcance de sus aplicaciones. 

En la demostración del teorema 7.18 construimos una sucesión de funciones 
{Y k } de acuerdo con la fórmula de recurrencia 


Y k+1 (x) = B+ f*AY k (t)dt. 
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E1 segundo miembro de esta fórmula puede considerarse como un operador T que 
convierte ciertas funciones Y en otras nuevas T(Y) mediante la ecuación 

T(Y) = B + j* AY(t)dt. 

En la demostración del teorema 7.18 encontramos que la solución Y del problema 
de valor inicial Y'(t) = AY(t), Y(a) = B, satisface la ecuación integral 

Y = B + j X AY(t)dt. 

Expresando ésta con el operador T resulta Y = T(Y). Es decir, la solución Y per- 
manece inalterada por el operador T. Una tal función Y se llama un punto fijo 
del operador T. 

Numerosos e importantes problemas del análisis pueden formularse de modo 
que su solución dependa de la existencia de un punto fijo para algún operador. 
Por consiguiente merece la pena intentar descubrir propiedades de operadores que 
garanticen la existencia de un punto fijo. Volvamos ahora a un tratamiento sis- 
temático de este problema. 

* 7.26 Espacios lineales normados 

Para formular el método de aproximaciones sucesivas en una forma más ge- 
neral conviene trabajar con espacios lineales. Sea S un 'espacio lineal cualquiera. 
Cuando hablamos de aproximar un elemento x de S mediante otro elemento 
y de S, consideramos la diferencia x — y, que llamamos el error de aproxima- 
ción. Para medir el tamano de ese error introducimos una norma en el espacio. 

definición de norma. Sea S un espacio lineal cualquiera. Una junción 
real N definida en S se llama norma si tiene las propiedades siguìentes: 

a) N(x) ^ 0 para cada x de S. 

b) N(cx) = |c| N(x) para cada x de S y cada escalar c. 

c) N(x + yK N(x) + N(y) para todo par x e y de S. 

d) N(x) = 0 implica x = O. 

Un espacio lineal con una norma asignada se llama espacio lineal normado. 

La norma de x a veces se indica con j|x|| en lugar de N(x). Con esta nota- 
ción las propiedades fundamentales se expresan: 

a) ||je|| > 0 para cada x de S. 

b) ||cx|| = |c| |M| para todo x de S y todo escalar c. 
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c) .\\x + y|| < ; IjcM + i|y|! para todo par x e y de S. 

d) ||x'j = 0 implica x = O. 

Si x e y están en S, la norma j!* — y|! se llama distancia de x a y. 

Si el espacio S es euclídeo, tiene siempre una norma que es consecuencia del 
producto interior, es decir, [\x\\ = (x, x) Vi . Sin embargo, nosotros nos interesare- 
mos por una norma especial que no resulta de un producto interior. 

ejemplo. La norma del máximo o max norma. Sea C(f) el espacio lineal 
de las funciones reales continuas en un intervalo cerrado y acotado /. Si q> e C(J), 
definimos 


llç’ll = max | (p(x)|, 

xeJ 

donde el símbolo del segundo miembro significa el máximo valor absoluto de 
q> en /. E1 lector puede comprobar que esta norma goza de las cuatro propieda- 
des fundamentales. 

La norma del máximo no se deduce del producto interior. Para demostrarlo 
basta hacer ver que la norma del máximo deja de cumplir alguna propiedad que 
poseen todas las normas deducidas de productos interiores. Por ejemplo, si una 
norma se deduce de un producto interior, la «ley del paralelogramo» 

Il^+Jll 8 + \\x-yV = 2 |*|>+2H> 

es válida para todo par x e y de S. (Ver ejercicio 16 de la sección 1.13). La ley 
del paralelogramo no siempre queda satisfecha por la norma del máximo. Por 
ejemplo, sean x e y funciones en el intervalo [0,1] dadas por 

x(t) = t, y(t) = 1 - t. 

Entonces tenemos ||x|| = ||y|| = ||x + y|| = ||* — y|| = 1, con lo que la ley de! 
paralelogramo no se cumple. 

* 7.27 Operadores de contracción 

En esta sección consideramos el espacio lineal normado C(J) de todas las 
funciones reales continuas en un íntervalo cerradù y acotado / en el que ||ç>|| es 
la norma del maximo. Consideremos un operador 

T: C(J)~* C(J) 

cuyo dominio es C(J) y cuyo recorrido es un subconjunto de C(J). Esto es, si q> es 
continua en /, entonces T(q>) también es continua en /. Las siguientes fórmulas 
dan algunos ejemplos sencillos de tales operadores. En cada caso q> es una función 
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arbitraria en C(J) y T(tp)(x ) se define para cada x de / por la fórmula que se 
indica 


T(<p)(x) = Xrp(x), donde A es un número real fijo, 

T(<p)(x) = j X <p(t) dt, donde c es un punto fijo en /, 

T(<p)(x) = b + j*f[t, <p(t )] dt, 

siendo b una constante y la función compuesta f[t,<p(t)~\ continua en /. 

Nos interesan ahora aquellos operadores T para los que la distancia ||T(ç)) — 
— 7'(y^) j j es menor que el producto de l|<p — V’ll por una constante a < 1. Esos se 
llaman operadores de contracción; se definen del modo siguiente. 

definición de un operador de contracción. Un operador T\ C(J)~>C(J) 
se llama de contracción si existe una constante a, que sea 0 ^ a < 1, tal que para 
todo par de funciones <p y de C(f) tenemos 

(7.70) \\T(<p)- T(y,)\\ y>\\. 

La constante a se llama constante de contracción para T. 

Nota: La desigualdad (7.70) es válida si y solamente si 


\T(<p)(x) - T(y>)(x) | <[ « ||go — V*ll para todo xd&J. 

eiemplo 1. Sea T el operador definido por T(q,)(x) = ><p(x), donde A es 
constante. Puesto que 


\T(<p)(x) - T( v )(x)\ = \X\ \<p(x) - P (x)\, 

tenemos ||T(<p) — T(ỳ)\\ — |A| ||^— Por consiguiente este operador es un ope- 
rador de contracción si y sólo si |A( < 1, en cuyo caso |A| puede usarse como cons- 
tante de contracción. 

EIEMPLO 2. Sea T(<p)(x) = b + J* f[t, y(í)] dt, donde / satisface una 
condición de Lipschitz de la forma 

\f(x,ý) ~f(x,z )| < K\y - z\ 

para todo x de /, y cualesquiera z e y reales; K es una constante positiva. Desig- 
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nemos con L(J) la longitud del intervalo /. Si KL(f) < 1 podemos ver fácilmente 
que T es un operador de contracción con la constante de contracción KL(f). En 
efecto, para toda x de / tenemos 


|T( 90 (x) - T(rp)(x )| = | J- {/[f, cp(t)] -f[t, v>(í)]} dt | < K | j“ \cp(t) - w ( t )\ dt | 

< K \\<p - yll | j* dt | < KL(J) ||<p - w \\ . 

Si KL(f) < 1, entonces T es un operador de contracción con constante de con- 
tracción a = KL(J). 

* 7.28 Teorema del punto fijo para operadores de contracción 

E1 teorema siguiente demuestra que todo operador de contracción tiene un 
punto fijo único. 

teorema 7.20. Sea T:C(f) -* C(f) un operador de contracción. Existe una 
función y sólo una tp en C(J) tal que 

(7.71) T(<p) = <p. 

Demostración. Sea <p 0 cualquier función de C(J) y definamos una sucesión 
de funciones {<p n } mediante la fórmula de recurrencia 

<Pn +1 = T(<p n ) para n = 0, 1, 2. 

Obsérvese que <p n + , e.C(J) para cada n. Demostraremos que la sucesión {<p n } con- 
verge hacia una función límite <p de C(J). E1 método es parecido al utilizado en 
la demostración del teofema 7.18. Escribimos cada <p n como suma telescópica, 


(7.72) 


<Pn(x) = <Po(x) + 2 {ÇVnOO “ <Pk(x)} 


y probamos la convergencia de {<p n } demostrando que la serie 
(7-73) <p 0 (x) +î{<p k+l (x) - <p k (x)} 


converge uniformemente en /. Luego demostramos que la suma de esa serie es el 
punto fijo que se cita. 
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La convergencia uniforme de la serie se estdblecerá comparándola con la 
serie geométrica convergente 


M '£a. k , 

donde M — ||ç , 0 || + ||?>i||, y « es la constante de contracción para T. La compa- 
ración la proporciona la desigualdad 

(7.74) l? , t + iW - 9> t (jr)| < Ma. k 

que es válida para toda x de / y todo fc > 1. Para demostrar (7.74) notemos que 


l<P*+i(*) - = I T(q> k )(x) - T(<p k ^)(x)\ < a \\<p k - . 

Por consiguiente la desigualdad (7.74) quedará probada si demostramos que 
(7-75) || <p k — <p k _,|| < Ma k - 1 

para todo fc> 1. Demostremos ahora (7.75) por inducción. Para fc = 1 tenemos 
II <Pi ~ Ç’oll ^ II Ç’ill + II T’oll = M, 

que es la misma que (7.75). Para demostrar que (7.75) es válida para fc + 1 si 
lo es para fc observemos que 


I%hW ~ ?*.(*)I = \T(<p k )(x) - T(<p k _J(x )| < a \\<p k - || < Ma k . 


Puesto que ésta es válida para cada x de / también debe ser 
IIí’í+i ~ 93*11 < M<x. k . 

Esto demuestra (7.75) por inducción. Por consiguiente la serie (7.73) converge 
uniformemente en /. Si designamos por <p(x) su suma tenemos 

(7.76) <p(x) = lim <p n (x) = <p 0 (x) + f {?> t+1 (x) - <p k (x)}. 

La función <p es continua en / porque es la suma de una serie uniformemente 
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convergente de funciones continuas. Para demostrar que (p es un punto fijo de T 
comparamos T(<p) con rp> n +i = T(<p n ). Utilizando la propiedad de contracción de 
T tenemos 

(7.77) | T(<p)(x) - <p nn (x)\ = | T(<p)(x) - T(<p n )(x)\ < « | <p(x) - <p n (x)\. 

Pero de (7.72) y (7.76) encontramos 


\<p(x) ~ <Pn(x)\ - | f {f k+ i(x) - <p k (x)} | < f l 9 >* +1 (x) - <p k (x) I < Aí fa\ 
donde hemos utilizado (7.74) en el último paso. Por consiguiente (7.77) implica 
I T(<p)(x) - <p n+1 (x)\ < m|«* +1 . 

Cuando la serie del segundo miembro tiende a 0, así que <p„ +ì (x)-*T(<p)(x). 

Pero ya que <p„ +1 (x)-*<p(x) cuando n-»oo, esto demuestra que <p(x) = T(<p%x) para 
cada x de /. Por consiguiente <p = T(q>), así que <p es un punto fijo. 

Por último demostramos que este punto fijo <p es único. Sea <j/ otra función 
de C(J) tal que T(<ỳ) = <f>. Tenemos entonces 

ii <p - v»ii = iinç’) - nvou ^« \\<p - y>\\ ■ 

Esto nos da (1 — «)||9 ) — ^jl<0. Puesto que a < 1 podemos dividir por 1 — « 
obteniendo la desigualdad i|ç>— ^ii < 0. Pero como también tenemos \[-<p— ^|| ^ 0 
ello significa que || <p— <f |i = 0, y por tanto <p— </< = 0. La demostración del teo- 
rema del punto fijo ha quedado concluida. 

* 7.29 Aplicaciones del teorema del punto fijo 

Para hacer ver el amplio alcance de las aplicaciones del teorema del punto 
fijo lo vamos a utilizar para demostrar dos teoremas importantes. E1 primero da 
una condición suficiente para que una ecuación de la forma f(x, y) = 0 defina y 
como función de x. 


TEOREMA 7.21. UN TEOREMA DE EXISTENCIA DE LA FUNCIÓN IMPLÍCITA. 
Sea f una función definida en una banda R de la forma 


R — {(*, .y)|a<x<Z>,— oo<j< +co}. 
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Supongamos que existe la derivada parcial D 2 f(x,y ) (,) y que satisface una des- 
igualdad de la forma 

(7.78) 0 < m < D 2 f(x, y) < M 

para todo punto (x, y) de R, donde m y M son constantes tales que m< M. Su- 
pongamos también que para cada función <p continua en \_a, b~\ la función com- 
puesta g(x) — f[x, <jp{x)] es continua en [a, 6]. Entonces existe una y sólo una 
función y = Y(x), continua en [a, b\ tal que 

(7.79) f[x, r(*)] = 0 
para todo x en [a, b\. 

Observaçión: Expresamos este resultado diciendo que la ecuación f(x, y) = 0 
sirve para definir y implícitamcnte como función de x en [a,b\. 

Demostración. Designemos con C el espacio lineal de las funciones conti- 
nuas en [a, £>], y definamos un operador T: C -> C mediante la ecuación 

T(v)(x) = <p(x) - y f[x, <p(x)] 

M 

para cada x de [a, b\. La constante positiva M es la de (7.78). La función 
T(<p)e C siempre que cp eC. Demostraremos que T es un operador de contracción. 
Una vez sabido esto se deducirá que T tiene un punto fijo único Y en C. Para 
esta función Y tendremos Y = T(Y) lo cual significa 

y(x) = y(x) - ~- f[x, y(x)j 
M 

para cada x de [ a , &]. Esto nos dará (7.79), como queríamos. 

Para demostrar que T es un operador de contracción consideremos la dife- 
rencia 

(7.80) T(<p)(x) - T(tp)(x) = <p(x) - tp(x) - f - [X -J x)] ~ f[x ' V (x l . 

M 

Según el teorema del valor medio para la derivación tenemos 

f[x, ?>(x)] -f[x, v>(x)] = D 2 f[x, z(x)][<p(x) - V (x)], 


(*) Dif(x, y) es la derivada de f(x,y) respecto a y, manteniendo x fijo. 
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dond^ z(x) está situada entre <p(x) y f(x). Por consiguiente (7.80) nos da 

(7.81) T(<p)(x) - T(y>)(x) = [rfx) - <p(x)] (l - . 

La hipótesis (7.78) implica que 

0 D 2 /[x, z (x)] m 

M ~ M 

En consecuencia (7.81) nos da la desigualdad 

(7.82) |r( 9 >)(x) - T(y>)(x)\ < \<p(x) - y<x)| ^l - < <x \\<p - y>\\, 

donde a = 1 — m/M. Puesto que 0 < m < M, tenemos 0 < a < 1. La desigual- 
dad (7.82) es válida para todo x de [a, &]. Luego T es un operador de contrac- 
ción. Esto completa la demostración. 

La otra aplicación del teorema del punto fijo establece un teorema de exis- 
tencia para la ecuación integral 

(7.83) <p(x) = y>(x) + X jj K(x, t)<p(t) dt. 

Aquí <p es una función dada, continua en [a, b], X es una constante dada, y K una 
función dada definida y acotada en el cuadrado 

S = {(*> j) I a<x<,b,a<y<,b). 

La función K se llama el núcleo de la ecuación integral. Sea C el espacio lineal 
de las funciones continuas en [a, b]. Supongamos que el núcleo K es tal que el 
operador T dado por 

T(<p)(x) = y>(x) + X jj K(x, t)<p(t) dt 

aplica C en C. Es decir, supongamos que T(<p)eC siempre que <peC. Una solu 
ción de la ecuación integral es cualquier función <p de C que satisfaga (7.83). 

TEOREMA 7.22. TEOREMA DE EXJSTENCIA PARA ECUACIONES INTEGRALES. Sí, 
en las condiciones impuestas, tenemos 

(7.84) !AT(x,y)| < M 

para todo punto (x, y) de S, siendo M > 0, entonces para cada À íal que 

(7.85) 


\X\ < -- 

M(b - a) 



294 


Sistemas de ecuaciones diferenciales 


existe una y sólo una función <p en C que satisface la ecuación integral (7.83). 

Demostración. Demostraremos que T es un operador de contracción. Tome- 
mos en C dos funciones cualesquiera <p t y <p 2 y consideremos la diferencia 

n<p&x) - n<pò (*) = x f k( X , o[?>i(o - <pm dt. 

Utilizando la desigualdad (7.48) podemos escribir 

\n<pù(x) - n<pà(x) | ^ \X\ M(b - a) II <p t - <p 2 II = a ||^ - <p 2 1|, 

siendo a = |A.| M(b — a). Por (7.85) tenemos 0 < a < 1, así que T es un opera- 
dor de contracción con a como constante de contracción. Por consiguiente T tiene 
un punto fijo <p único en C. Esta función <p satisface (7.83). 
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CALCULO DIFERENCIAL EN CAMPOS 
ESCALARES Y VECTORIALES 


8.1 Funciones de R" en R m . Campos escalares y vectoriales 

La parte 1 de este volumen se dedica principalmente a las transformaciones 
lineales 


T: W 

de un espacio lineal V en otro espacio lineal W. En la parte 2 prescindimos de 
que T sea lineal pero restringimos los espacios V y W a ser de dimensión finita. 
Concretamente, consideramos funciones con el dominio en el espacio n-dimensio- 
nal R n y con el recorrido en el espacio m-dimensional R"‘. 

Cuando los dos números m y n son iguales a 1, una tal función se llama 
función real de una variable real. Cuando h = 1 y m > 1 se llama función vec- 
torial de una variable real. En el Volumen I se estudiaron ampliamente ejemplos 
de tales funciones. 

En este capítulo suponemos n > 1 y m> 1. Cuando m = 1 la función se 
llama función real de una variable vectorial o, más brevemente, un campo escalar. 
Cuando m > 1 se llama función vectorial de una variable vectorial, o simple- 
mente campo vectorial. 

Este capítulo extiende los conceptos de límite, continuidad y derivada, a 
los campos escalares y vectoriales. Los Capítulos 10 y 11 extienden el concepto 
de integral. 

Notación: Los escalares se designarán con tipo de letra corriente, y los vec- 
tores con tipo de letra negrita. Si / es un campo escalar definido en un punto 
x = (x r ,... ,x„) en R”, la notación f(x) y f(x ly ..., x„) se usan indistintamente 
para designar el valor de / en un cierto punto. Si / es un campo vectorial pone- 
mos f(x) o f(x lt . . . ,x„) para el valor de la función enx . Utilizaremos el producto 
interior 
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xy = 


y la correspondiente norma ||x|| = (ac • x)' A , donde x = (xi,. . .,x n ) e y= (yi, . . ,y„). 
Los puntos de R 2 ordinariamente se indican por (x, y) en lugar de (x,, x- 2 ); y los 
de R 3 por (x, y, z) en lugar de (*„ x 2 , x 3 ). 

Los campos escalares y vectoriales definidos en subconjunto de R 2 y R 3 se 
presentan con frecuencia en las aplicaciones de la Matemática a las Ciencias natu- 
rales y a la Ingeniería. Por ejemplo, si a cada punto x de la atmósfera le asigna- 
mos un número real f(x) que represente la temperatura en x , la función / así 
definida es un campo escalar. Si asignamos un vector que represente la velocidad 
del viento en aquel punto, obtenemos un ejemplo de campo vectorial. 

En problemas de Física que tratan con campos escalares o vectoriales es 
importante saber cómo varía el campo al pasar de un punto a otro. En el caso 
uni-dimensional la derivada es el instrumento matemático utilizado para estudiar 
tales cambios. La teoría de la derivada en el caso uni-dimensional maneja fun- 
ciones definidas en intervalos abiertos. Para extender la teoría a R n consideramos 
generalizaciones de intervalos abiertos llamados conjuntos abiertos. 

8.2 Bolas abiertas y conjuntos abiertos 

Sean a un punto dado en R" y r un número positivo dado. E1 conjunto de 
todos los puntos x de R” tales que 


II* - «|| < r 

se llama n-bola abierta de radio r y centro a. Designamos este conjunto con B(a;r). 

La bola B(a;r) está c nstituida por los puntos cuya distancia a a es menor 
que r. En R 1 es simplemente un intervalo abierto con punto medio en «. En R 2 
es un disco circular, y en R 3 es un sólido esférico con centro en a y radio r. 

definición de punto interior. Sea S un subconjunto de R", y suponga- 
mos que a e S. Se dice que a es punto interior de S si existe una n-bola abierta 
con centro en a, cuyos puntos pertenecen todos a S. 

Es decir, todo punto a interior de S puede rodearse por una n-bola B(a) tal 
que B(a)^S. E1 conjunto de todos los puntos interiores de S se llaman el interior 
de S y se designa con in S. Un conjunto abierto que contenga un punto a se llama 
a veces entorno de a. 

definición de conjunto abierto. Un conjunto S de R’* sc llama abierto 
si todos sus puntos son interiores. Es decir, S es abierto si y sólo si S = int S. 
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ejemplqs. En R 1 el tipo más sencillo de conjunto abierto es un intervalo 
abierto. La reunión de dos o más intervalos abiertos es también abierto. Un inter- 
valo cerrado [a, b] no es un conjunto abierto porque ninguno de los extremos 
del intervalo puede encerrarse en una 1-bola situada enteramente en el intervalo 
dado. 

La 2-bola S = B(0;í) dibujada en la figura 8.1 es un ejemplo de conjunto 
abierto en R 2 . Todo punto a de S es el centro de un disco situado por entero 
en S, Para algunos puntos el radio de este disco es muy pequeno. 

Algunos conjuntos abiertos en R 2 pueden construirse tomando el producto 
cartesiano de conjuntos abiertos en R 1 . Si A t y A 2 son subconjuntos de R 1 , su 
producto cartesiano A x X A 2 es ! el conjunfo deftnido en R 2 por 

A t X A 2 = {(flj, a^) | a x 6 A t and a t e A 2 }. 


En la figura 8.2 se ha dibujado un ejemplo. Los conjuntos A a y A 2 son interva- 
los, y Aj X A 2 es un rectángulo. 

Si Ai y A a son subconjuntos abiertos de R 1 , entonces A 2 X A 2 será un sub- 
conjunto abierto de R 2 . Para probar esto, elijamos un punto cualquiera a = (a,, a 2 ) 



disco circular 



Figura 8.1 El disco B(0; 1) es un conjun- Figura 8.2 El producto cartesiano de dos 
to abierto en R 1 intervalos abiertos es un rectángulo abierto. 

en Ai X A 2 . Tenemos que demostrar que a es un punto interior de A± X A 2 . 
Puesto que A, y A 2 son abiertos en R 1 existe una 1-bola B(a,; r,) en A, y una 
1-bola B(a 2 ;r 2 ) en A 2 . Sea r = min{n, r 2 }. Podemos fácilmente demostrar que 
la 2-bola (B ( a ; r) s A x X A 2 . En efecto, si x = (x,, x 2 ) es un punto cualquiera 
de B(a; r) entonces ||x - a\\ < r, así que |x t - a 2 \ < r, y \x 2 - a 2 \ < r 2 . Luego 
Xi e B(a,; r,) y x 2 e B(a;r 2 ). Por consiguiente x t e A, y x 2 e A 2 ,así que (x,, x 2 ) 
e Aj X A, 2 . Esto demuestra que todo punto de B(a; r) está en A, X A 2 . Por lo 
tanto todo punto de A x X A 2 es un punto interior, así que A, X A 2 es abierto. 

E1 lector debería comprobar que un subconjunto abierto de R 1 ya no es un 
conjunto abierto cuando se considera como subconjunto de R 2 , porque un sub- 
conjunto de R 1 no puedè contener una 2-bola. 
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definiciones de exterior Y frontera. Un punto x se llama exterior al 
conjunto S de R" si existe una n-bola B(x) que no contiene puntos de S. El con- 
junto de todos los puntos de R" exteriores a S se ílama el exterior de S y se de- 
signa con ext S.Un punto que no es interior ni exterior a S se llama punto fron- 
tera de S. El conjunto de todos los puntos frontera de S es la frontera de S y se 
designa con 3 S. 

Estos conceptos se representan en la figura 8.1. E1 exterior de S es el con- 
junto de todos los x tales que ||x|| > 1. La frontera de S la constituyen todos 
los X con || jc 11 = 1. 

8.3 Ejercicios 


1. Sean / un campo escalar definido en un conjunto S y c un número real dado. E1 con- 
junto de todos los puntos x de S tales que f(x)= c se llama conjunto de nivel de /. 
(En un capítulo posterior se discutirán problemas geométricos y físicos en los que se pre- 
sentan conjuntos de nivel.) Para cada uno de los campos escalares siguientes, S es todo 
el espacio R”. Hacer un dibujo para describir los conjuntos de nivel correspondientes a 
los valores dados de c. 


a) /(x,y) =* 2 +y?, c = 0, 1,4,9. 

b) f(x, y) = e x,J , c = e~ *, é~ l , 1, e, e *, e 3 . 

c) f(x,y) = cos (x + .y), c = -1,0, i, \yfl, 1. 

d ) f(x,y,z) = x + y + z, c= -1,0,1. 

e) f(x, y, z) = x 2 + 2y 2 + 3z 2 , c = 0, 6, 12. 

f) /(*, y,z) =sen(x*+ y*+z 2 ), c= -1, 0,| N /2, 1. 

2. En cada' uno de los casos siguientes, sea S el conjunto de todos los puntos (x, y) del 
plano que satisfacen las desigualdades dadas. Hacer un gráfico mostrando el conjunto S 
y explicar, geométricamente, si S es o no abierto. Indicar la frontera de S en el gráfico. 

a) x* +/ < 1. h) 1 ^ x ^ 2 y 3<j<4. 

b) 3x* + 2y* < 6. i) 1 < x < 2 y y > 0. 

c) 1*1 < 1 y |_y| < 1. j) x > y. 

d) x^0y_y>0. k)x>_y. 

e) W < 1 y lyl ^ 1. 1) y > x 2 y |jc| < 2. 

f) x > 0 y y < 0. m) (** +/ - 1)(4 - x* -/) > 0. 

g) xy < 1. n) (2x — x* -/)(** + y 2 - x) > 0. 

3. En cada uno de los siguientes casos, sea S el conjunto de todos Ios puntos (x,y , z), en 
el espacio tri-dimensional, que satisfacen las desigualdades dadas y determinar si S 
es o no abierto. 


a) z* — x 2 — y 2 — 1 > 0. 

b) |*| < 1, lyl < 1, y |*| < l. 

c) X + y + z < 1. 

d) |*| £ 1, \y\ < 1, y |z| < 1. 

e) x+y+z<l yx>0,y>0,z>0. 

f) x* + 4y* + 4z* - 2x + 16 y + 40z + 113 < 0. 
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4. a) Si A es un conjunto abierto en un espacio de dimensión n y si xl £ A, demostrar 
que el conjunto A — {x}, obtenido suprimiendo de A el puntojc, es abierto. 

b) Si A es un intervalo abierto en la recta real y B un subintervalo de A cerrado, de- 
mostrar que A — B es abierto. (*) 

c) Si A y B son intervalos abiertos en la recta real, demostrar que A n B y A u B son 
abiertos. 

d) Si A es un intervalo cerrado en la recta real, demostrar que su complemento (res- 
pecto a la recta real completa) es abierto. 

5. Demostrar las siguientes propiedades de los conjuntos abiertos en R": 

a) E1 conjunto vacío 0 es abierto. 

b) R* es abierto. 

c) La reunión de una colección cualquiera de conjuntos abiertos es un conjunto abierto. 

d) La intersección de una colección finita de conjuntos abiertos es un conjunto abierto. 

e) Dar un ejemplo para demostrar que la intersección de una colección infinita de con- 
juntos abiertos no es necesariamente abierta. 

Conjuntos cerrados. Un conjunto S en R* se llama cerrado si su complemento 
R” — S es abierto. Los tres ejercicios siguientes se refieren a las propiedades de los 
conjuntos cerrados. 

6. En cada uno de los siguientes casos, sea S el conjunto de todos los puntos (x,y) de R 2 
que satisfacen las condiciones dadas. Hacer un gráfico mostrando el conjunto S y dar 
una razón geométrica para explicar si S es abierto, cerrado, cerrado y abierto a la vez, 
o ni cerrado ni abierto. 


a) 

* s 

! +/ 

1 £ 0 . 

g) 

1 ^x <2,3 <.y <, 4. 

b) 

x s 

1 +/ 

! < 0 . 

h) 

1 ^x £2,3 <4. 

c) 

x s 

1 +/ 

! £1. 

i) 

y=x*. 

d) 

1 

<x 2 

+ / < 2. 

j) 

yïx*. 

e) 

1 


+ fú 2. 

k) 

y'tx* y |x| < 2. 

0 

1 

<x 2 

+ f<, 2. 

1) 

ytx*- y |x| <2. 

a) 

Si 

A es 

un conjunto cerrado e 

n el espacio r 

i-dimensional y x es un punto no perte- 


neciente a A, demostrar que A U {x} es también cerrado. 

b) Demostrar que un intervalo cerrado [a, b) en la recta real es un conjunto cerrado. 

c) Si A y B son intervalos cerrados en la recta real, demostrar que A n B y A u B son 
cerrados. 

8. Demostrar las propiedades siguientes de los conjuntos cerrados de R’. Pueden utilizarse 
los resultados del ejercicio 5. 

a) E1 conjunto vacío 0 es cerrado. 

b) R" es cerrado. 

c) La intersección de una colección cualquiera de conjuntos cerrados es cerrada. 

d) La reunión de un número finito de conjuntos cerrados es cerrada. 

e) Dar un ejemplo para probar que la reunión de una colección infinita de conjuntos 
cerrados no es necesariamente cerrada. 

9. Sea S un subconjunto de R*. 

a) Demostrar que intS y extS son ambos conjuntos abiertos. 

b) Demostrar que R’ = (int S) u (ext S) u 9S, es una reunión de conjuntos disjuntos, 
y utilizar esto para deducir que la frontera 3S siempre es un conjunto cerrado. 

(*) Si A y B son dos conjuntos, la diferencia A — B (llamada complemento de B res- 
pecto de A) es el conjunto de todos los elementos de A que no pertenecen a B. 
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10. Dado un conjunto S de R“ y un punto x con la propiedad de que toda bola B(x) con- 
tiene puntos interiores y exteriores a S simultáneamente. Demostrar que x es un punto 
frontera de S. iEs cierta la proposición inversa? Esto es, itodo punto frontera de S 
tiene necesariamente esta propiedad? 

11. Sea S un subconjunto de R". Demostrar que extS = int (R* — S). 

12. Demostrar que un conjunto S de R* es cerrado si y sólo si S = (int S ) u dS. 

8.4 Límites y continuidad 

Los conceptos de límite y continuidad se pueden extender con facilidad a 
los campos escalares y vectoriales. Formularemos las definiciones para campos vec- 
toriales; las mismas se extienden a los campos escalares. 

Consideremos una función f: S —*R m , donde S es un subconjunto de R". Si 
a e R" y ígR” escribimos 

(8.1) lim/(x) = A (o, f(x) -+ b cuando ,r ->- à) 
para significar que 

(5.2) nJim_o II /(*) - *ll = 0. 

E1 símbolo de límite de la igualdad (8.2) es el límite corriente del Cálculo ele- 
mental. En esta definición no se exige que / esté definida en el mismo punto a. 
Si escribimos h — x — a , l a igualdad (8.2) se convierte en 

II/(« + h) — A|| =0. 


Para los puntos de R 2 escribimos (x, y) para x y (a, b) para a y expresamos la 
relación de límite (8.1) como sigue: 

lim f(x, y) = b. 

(x,v)->(a, bì 

Para los puntos de R 3 ponemos x = (x, y, z) y « = (a, b, c) y escribimos 
( „ /( x ’ y ’ z ) = b • 


Una función / se llama continua en a si / está definida en « y si 
lim/(x) =/(«). 

Decimos que / es continua en un conjunto S si /es continua en cada punto de S. 
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Puesto que esas definiciones son extensiones directas del caso uni-dimensio- 
nal, no debe sorprender que muchas de las propiedades de los límites y de la 
continuidad pueden también extenderse. Por ejemplo, los teoremas relativos a 
los límites y a la continuidad de sumas, productos y cocientes son también cier- 
tos para campos escalares. Para campos vectoriales, los cocientes no están defi- 
nidos pero tenemos el teorema siguiente relativo a sumas, multiplicación por es- 
calares, productos interiores y normas. 

teorema 8.1. Si lim f(x) = b y lim g(x) = c\, tenemos también: 

a) lim [f(x) + í(jc)] = b + c. 

b) Hm lf(x) = Xb para todo escalar A. 

c) lim f(x) ■ g(x) = b - c. 

d) îim H/(*)|| = |iA||. 

Demostración. Sólo vamos a demostrar las partes c) y d); las demostracio- 
nes de a) y b) se dejan como ejercicios para el lector. 

Para demostrar c) escribimos 

f(x)-g(x) - b ■ c = [f(x)~ b] • [*(*) - c] + b-[g(x) - c) + c •[/(*)- b]. 

Apliquemos ahora la desigualdad triangular y la desigualdad de Cauchy-Schwarz 
obteniendo 

0 < \\f(x)'g(x) -b c || < ||/(*) - b\\ Hí(jr) - c|| + \\b\\ ||*(jt) - c|| + ||c|| ||/(*) - b\\ 

Puesto que ||/(x) — A|| -> 0 y lltfOc) — c|| -»■ 0 cuando jc -*■ a , esto prueba que 
\\Âx) • g(x) — b • c|| -► 0 cuando x-+a, lo cual demuestra c). 

Tomando /fx) = g(x) en el apartado c) encontramos 

lim ||/(*)f = ||*f, 


de la que obtenemos d). 

ejemplo 1. Continuidad y componentes de un campo vectorial. Si un cam- 
po vectorial / tiene los valores en R m , cada uno de los valores /(*) tiene m com- 
ponentes y podemos escribir 


Âx) = (/(*),... ,/ m (*)). 
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Los m campos escalares ,f m se llaman componentes del campo vectorial /. 

Demostraremos que / es continuo en un punto si, y sólo si, cada componente f k 
es continuo en dicho punto. 

Designemos con e k el fc-ésimo vector coordenado unidad (todos los compo- 
nentes de e k son 0 excepto el Ar-ésimo, que es igual a 1). Entonces f k (x) viene 
dado por el producto interior 


/*(*) =f(x) ■ e k . 

Por consiguiente, el apartado c) del teorema 8.1 demuestra que cada punto de 
continuidad de / lo es también de fk. Además, puesto que tenemos 

f(x) =îf k (x)e k , 

la aplicación reiterada de los apartados a) y b) del teorema 8.1 demuestra que 
un punto de continuidad de todos los m componentes f„ ... ,} m es también punto 
de continuidad de /. 

ejemplo 2. Continuidad de la función identidad. La función identidad, 
f(x) = x , es continua en todo R n . Por tanto sus componentes también son con- 
tinuos en todo R”. Esos son n campos escalares dados por 

fi(x) = x x ,/ 4 (jr) = **,... ,f n (x) = x n . 

ejemplo 3. Continuidad de las transformaciones lineales. Sea /: R” -► R” 
una transformación lineal. Demostraremos que / es continua en cada punto a de 
R”. En virtud de la linealidad tenemos 

f(a + h) —f(a) +f(h). 

Por consiguiente, basta demostrar que f(h) -► O cuando h -*■ O . Poniendo h en 
función de sus componentes tenemos h = h k e x + • • • + h n e n . Usando la linea- 
lidad, tenemos f(h) = hj(e^) + • • • + h n f(ef ). Esto demuestra que f(h) -*■ O 
cuando A -► 0. 

ejemplo 4. Continuidad de los polinomios de n variables. Un campo es- 
calar P definido en R n por una fórmula de la forma 

P(x) = ï o ---ï o c ki ... kn x k f---xf 

se llama polinomio de n variables x lt ... pc n . Un polinomio es continuo en todo 
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R" debido a que es una suma finita de productos de campos escalares continuos 
en todo R". Por ejemplo, un polinomio de dos variables x e y, dado por 


P(x, y) = i i c ijX y 

1=0 3=0 


es continuo en todo punto (x, y) en R 2 . 

ejemplo 5. Continuidad de las funciones racionales. Un campo escalar f 
dado por f(x) = P(x)lQ(x), donde P y Q son polinomios en los componentes 
de x, se llama función racional. Tal función es continua en cada punto en donde 
Q(x)* 0. 

Pueden construirse otros ejemplos de funciones continuas con la ayuda del 
siguiente teorema, que está relacionado con la continuidad de las funciones com- 
puestas. 

teorema 8.2. Sean f y g dos funciones tales que la función compuesta 
f°g está definida ena, siendo 

(f°g)(x) =f[g(x) ]. 

Si g es continua en a y f es continua en g(a), la función compuesta f°ges con- 
tinua en a. 

Demostración. Sean y=f(x) y b — g(a). Tenemos 

/[*(*)] -/[*(«)] =f(y) -m- 

Por hipótesis, y —>■ b cuando x -*■ a, así que tenemos 

„ Hm II/[#(*)] ~/[g(«)]|| = lim H/O) -f(b) |! = 0. 

Por consiguiente' lim /[g(x)j = f[g(a)] , así que f ° g es continua en a. 

ejemplo 6. E1 teorema anterior implica la continuidad de los campos esca- 
lares h, cuando h(x, y) está dada por fórmulas tales como 


sen (x 2 y), log (x 2 + y 2 ), 


é c+v 
x + y 


log [cos (x 2 + /)]. 
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En estos ejemplos las funciones son continuas en todos los puntos en los que están 
definidas. La primera lo es en todos los puntos del plano y la segunda en todos los 
puntos excepto en el origen. La tercera es continua en todos los puntos (x, y) en 
los que x: + y # 0, y la cuarta en todos los puntos en los que x 2 + y 2 no sea un 
múltiplo impar de tt/ 2. [E1 conjunto de los puntos (x, y) tales que x 2 + y 2 = 
n~/2, n = 1, 3, 5,.... es una familia de circunferencias con centro en el origen.] 
Estos ejemplos demuestran que las discontinuidades de una función de dos varia- 
bles pueden ser puntos aislados, curvas, o familias de curvas. 

eiemplo 7. Una función de dos variables puede ser continua respecto a 
cada variable separadamente y en cambio ser discontinua como función de dos 
variables. Esto lo apreciamos en el ejemplo siguiente: 

f(x,y) = si (+ y) * (o, o), /(o,o) = o. 

Para los puntos (x, y) del eje x tenemos y = 0 y f(x, y) = f(x, 0) = 0, así que 
la función tiene el valor constante 0 en todo el eje x. Por consiguiente, si pone- 
mos y = 0 y consideramos / sólo como función de x, dicha / es continua en x = 0. 
Análogamente, / tiene el valor constante 0 en todos los puntos del eje y, así que 
si ponemos x = 0 y consideramos / como función sólo de y, f es continua en 
y = 0. No obstante, como función de las dos variables, / no es continua en el ori- 
gen. En efecto, en cada punto de la recta y = x (excepto en el origen) la función 
tiene el valor constante Vi ya que f(x, x) = x 2 /(2x 2 ) = Vs; puesto que existen 
puntos en esa recta tan próximos al origen como queramos y ya que /(0, 0) V=V%, 
la función no es continua en (0, 0). 

8.5 Ejercicios 


Los ejercicios de esta seccíón se refieren a límites y a la continuidad de campos escalares 
definidos en subconjuntos del plano. 

1. En cada uno de los siguientes ejemplos se define un campo escalar / mediante la ecua- 
ción dada para todos los puntos (x,y) del plano definidos por la expresión del segundo 
miembro. Determinar en cada ejemplo el conjunto de puntos (x,y) en los que / es 
continua. 

a ) /(*> y) = * 4 + / - 4 xy. d) f(x, y) = tg j . 

b) f(x, y) = log (+ + y 2 ). e) f(x, y) = arc tg - . 


f) f(x,y) =arc sen — . 

V* 2 +/ 


c) f(x,ý) = - cos x 2 . 
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g )/c*.jo 


1 — xy ‘ 


h)/(x,j) 


V^+ 7 ' 


i) f(x,y)=x^>. 

j) /(*>j) = arccos yjxjy. 


2. Si lim f(x, y) = L, y si existen los dos límites uni-dimensionales 

lim f(x,y) y lim/(x,j) 

I—o 6 

demostrar que 

lim [lim f(x,y)] = lim [lim f(x,y)] = L. 

x-*a v-»6 v—b *-»a 

Los dos límites de esta igualdad se llaman límites iterados; los ejercicios demuestran 
que la existencia del límite bidimensional y de los dos límites unidimensionales, implican 
la existencia e igualdad de los dos límites ìterados. (E1 recíproco no siempre es cíerto. 
En el ejercicio 4 se da un contraejemplo.) 

3. Sea f(x, y) = (x — y)/(x + y) si x + y ^ 0. Demostrar que 

lim [lim/(x,j)] = 1 pero que lim [lim/(x,j)] = -1. 


Utilizar ese resultado y el del ejercicio 2 para deducir que f(x, y) no tiende a un límite 
cuando (x, y) -* (0,0). 

4. Sea 


fix.y) 

Demostrar que 


X 2 y 2 

~ŷ + ( X -yf siem P re <i ue *y + (* -yf * 0. 
lim [Iim f(x,y)] = lim [lim f(x,y)] = 0 


pero que f(x,y) no tiende a un límite cuando (x, y) -» (0,0). [ Indicación : Examinar f 
sobre la recta y = x.] Este ejemplo demuestra que el recíproco del ejercicio 2 no siem- 
pre es cierto. 




si y * 0, 
si / = 0. 


Demostrar que f(x, y) —> 0 cuando (x, y) -> (0,0) pero que 


lim [lim f(x,y)] jt ii m [lim f(x, j)]. 
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Explicar por qué esto no contradice el ejercicio 2. 

6. Si (x, y) ^ (0,0), pongamos f(x, y) = (x 1 — Ý)/(x? + Ý)- Hallar el límite de f(x,y) cuan- 
do (x, y) -> (0,0) a lo Iargo de la recta y = mx. iEs posible definir /(0,0) de modo que f 
sea continua en (0,0)? 

7. Sea f(x, y) = 0 si y < 0 o si y > x 2 y sea f(x, y) = 1 si 0 < y < x 1 . Demostrar que 
f(x, y) —> 0 cuando (x, y) —> (0,0) a lo largo de cualquier recta por el origen. Hallar 
una curva que pase por el origen a lo Iargo de la cual (salvo en el origen) f(x, y) tiene 
el valor constante 1. iEs f continua en el origen? 

8. Si f(x,y) = [sen(x 2 + y 2 )]/** 2 + y J ) cuando (x,y) ^ (0,0) icómo debe definirse /(0,0) 
para que sea / continua en el origen? 

9. Sea / un campo escalar continuo en un punto a interior a un conjunto S de R“. Si 
f(a) 0, demostrar que existe una /i-bola B(a) en la que / tiene el mismo signo que f(a). 


8.6 La derivada de un campo escalar respecto a un vector 

Esta sección introduce las derivadas de campos escalares. En la sección 8.18 
se discuten las derivadas de campos vectoriales. 

Sea / un campo escalar definido en un conjunto S de R”, y sea a un punto 
interior a S. Deseamos estudiar la variación del campo cuando nos desplazamos 
desde « a un punto próximo. Por ejemplo, supongamos que f(a) es la tempera- 
tura en un punto a en una habitación con calefacción y con una ventana abierta. 
Si nos movemos hacia la ventana la temperatura decrecerá, pero si nos acercamos 
al radiador de la calefacción aumentará. En general, la variación del campo de- 
penderá de la dirección en la que nos movamos a partir de a. 

Supongamos que se representa esa dirección mediante otro vector y. Esto 
es, supongamos que nos movemos desde a hacia otro punto a + , siguiendo el 
segmento de recta que une a con a + y. Cada punto de este segmento tiene la 
forma a + hy, donde h es un número real. En la figura 8.3 se muestra un ejem- 
plo. La distancia desde a hasta a + hy es \\hy\\ = \h\ ||y||. 



Figura 8.3 El punto a ‘+ hy está en la 
recta paralela a a que pasa por y. 


Figura 8.4 El punto a + hy está 
n-bola B(a; r) si \\hy\\ < r. 


la 
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Puesto que a es un punto interior de S, existe una rc-bola B(a; r) situada en- 
teramente en S. Si h se elige de manera que \h\ ||j7|| < r, el segmento desde a 
hasta a + hy estará en S. (Ver figura 8.4) Mantengamos h ¥ 0 pero lo bastante 
pequeno para que a + hy e S y construyamos el cociente de diferencias 

(8 3) /(« + M ~/( g ) 

h 


E1 numerador de este cociente pone de manifiesto el cambio de la función cuando 
nos desplazamos desde a a a + hy. E1 cociente se denomina a su vez el prome- 
dio de variación de / en el segmento de recta que une a con a + hy. Nos inte- 
resa el comportamiento de ese cociente cuando h ~*0. Esto nos lleva a la siguiente 
definición. 


DEFINICIÓN DE LA DERIVADA DE UN CAMPO ESCALAR RESPECTO A UN VECTOR. 

Dado un campo escalar f: S -*■ R , donde S s R". Sean a un punto interior a S 
e y un punto arbitrario de R’ 1 . La derivada de f en a con respecto a y se repre- 
senta con el símbolo f'(a; j) y se define 


(8.4) 


f\a;y) 


f(a + hy) — f(a) 
h 


cuando tal límite existe. 

ejemplo 1. Si y = O, el cociente de diferencias (8.3) es 0 para todo h¥0, 
así que /'(«»' O) existe siempre y es igual a 0. 

ejemplo 2. Derivada de una transformación lineal. Si f: S-+ R es lineal, 
entonces f(a -f hy) = f(a) -f hf(y) y el cociente de diferencias (8.3) es igual a 
f(y) para todo h ¥ 0. En este caso, f(a;ý) existe siempre y está dada por 

f'(a;y) =f(y) 

para todo a de S y todo y de R" . Dicho de otro modo, la derivada de una trans- 
formación lineal respecto a y es igual al valor de la función en y. 

Para estudiar el comportamiento de / sobre la recta que pasa por a y a + y 
para y ^ O introducimos la función 

g(0 =f( a + O0- 

E1 teorema que sigue relaciona las derivadas g'(t) y f'(a + ty; j). 
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teorema 8.3. Si g(t) = f(a + ty) y si una de las derivadas g(t) of'(a+ty;y) 
existe, entonces también existe la otra y coinciden, 

(8.5) #'(0 =/'(« + ty\ý). 

En particular, cuando t = 0 tenemos g'(O) = f'(a;y). 

Demostración. Formando el cociente de diferencias para g, tenemos 

g(t + h) - g(t) _ f(a + ty + hy) - f(a + ty) 
h h 

Haciendo que h -> 0 obtenemos (8.5). 

ejemplo 3. Calcular f(a;y) si f(x) = [|*|| 2 para todo x en R n . 

Solución. Pongamos g(t) = f(a + ty ) = (a + ty) • (a + tý) = a ■ a + 2ta ■ y 
+ t 2 y ■ y. Por consiguiente g'(t) = 2a • y + 2ty ■ y, así que g'(0) = f'fa; y) = 
2 ay. 

Un corolario sencillo del Teorema 8.3 es el teorema del valor medio para 
campos escalares. 

TEOREMA 8.4. TEOREMA DEL VALOR MEDIO PARA DERIVADAS DE CAMPOS 

escalares. Supongamos que existe la derivada f’(a + ty;ý) para cada t en el 
intervalo 0 < t < 1. Entonces para un cierto número real 9 en el intervalo abierto 
0 < 6 < 1 tenemos 

f(a + v) -f(a) =f’(z; y) , donde z = a + 6y. 

Demostración. Pongamos g(t) = f(a + tý) . Aplicando el teorema del valor 
medio uni-dimensional a g en el intervalo [0, 1] tenemos 

£0) — £(0) = g’(0), donde 0 < 0 < 1. 

Puesto que g(l) - g(0) = f(a + ý) - f(a) y gf(9) = f (a + 9y;y), esto com- 
pleta la demostración. 

8.7 Derivadas direccionales y derivadas parciales 

En el caso particular en el -que y es un vector unitario, esto es, cuando 
llj'll = 1, la distancia entre a y a + hy es |ft|. En tal caso el cociente de diferen- 
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cias (8.3) representa el promedio de variación de / por unidad de distancia a lo 
largo del segmento de recta que une a con a + hy ; la derivada f'(a;y ) se deno- 
mina derivada direccional. 

DEFINICIÓN DE DERIVADAS DIRECCIONAL Y PARCIAL. Si y es Un veCtOr Uni- 
tario, la derivada f'(a;y)se llama la derivada direccional de f en a en la direc- 
ción de 3?. En particular, si y = e k (el k-ésimo vector coordenado unitario) la 
derivada direccional f'(a;e k ) se denomina derivada parcial respecto a e k y se 
representa también mediante el símbolo Dkf(à). Así pues 

D k f(a)=f'(a;e k ). 

Las siguientes notaciones se usan también para la derivada parcial D k f(a): 

D k f(a t . a„), ff- (a k ,..., a n ), y /**(«! 

ax k 

Algunas veces la derivada f’ Xk se escribe sin el ápice f Xk ,o incluso más sencilla- 
mente f k . 

En R 2 los vectores coordenados unidad se designan por / y /. Si a = (a, b) 
las derivadas parciales /'(«;/) y /'(«;/) también se escriben 

f(a,b) y — (a, b), 
ox oy 

respectivamente. En R 3 , si a = (a, b, c) las derivadas parciales DJ(a), D 2 f(a), 
y D 3 f(a) se expresan poniendo 

~ (a, b, c), $f-(a,b,c), y ?f(a,b,c). 

ox oy oz 


8.8 Derivadas parciales de orden superior 

La derivación parcial origina nuevos campos escalares Df,..., D„f a partir 
de un campo escalar dado /. Las derivadas parciales de D k f,..., D„f se llaman 
derivadas parciales de segundo orden de /. Para funciones de dos variables exis- 
ten cuatro derivadas parciales de segundo orden, que se escriben así: 
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Obsérvese que D,(D 2 /) significa la derivada parcial de D 2 / respecto a la primera 
variable. Algunas veces utilizamos la notación D;,,/ para indicar la derivada par- 
cial Di(Dji). Por ejemplo, D 1-2 / = DJDJ). También utilizamos la notación 

gy = im 

dy dx dy \3x/ 

Ésta puede ser o no igual a la otra derivada parcial mixta, 

g 2 / = i./§A 

dx dy dx \d_v/ 

En la sección 8.23 demostraremos que las dos derivadas parciales mixtas DJDJ) 
y Do(D,/) son iguales en un punto si una de ellas es continua en un entorno del 
punto. También la sección 8.23 contiene un ejemplo en el que D,(D 2 f) ¥= DJDJ) 
en un punto. 

8.9 Ejercicios 

1. Un campo escalar / está definido en R" mediante la ecuación f(x) = a ■ x, donde a es 
un vector constante. Calcular f'(x; /») cualesquiera que sean xe/. 

2. a) Resolver el ejercicio 1 cuando f(x) = ||jc|| 4 . 

b) Tomar n = 2 en a) y hallar todos los puntos (x, y) para los cuales /' (2/ + 3 j; xi + 

yj) = 6 • 

c) Tomar n = 3 en a) y hallar todos los puntos (x,y,z) para los cuales/'(/ + 2 j + 3 k; 
xi + yj + zk) = 0. 

3. Sea T: R” —» R" una transformación lineal dada. Calcular la derivada f'(x\y) para el 
campo escalar defìnido en R” mediante la ecuación f(x) = x • T(x). 

En cada uno de los ejercicios del 4 al 9, calcular todas las derivadas parciales de primer 
orden del campo escalar dado. En los ejercicios 8 y 9 los campos están defmidos en R”. 

4. f(x,ý) = x 2 +/sen(xj). 7. f(x,ý) = , x*y. 

5. f(x,y) = Jx* + _y*. 8. f(x)=a x, a fijo. 

6. f(x,y) = ^== > (x,y)*(0,0). 9./(x)=Ì| Wí , «,=«,, 

En cada uno de los ejercicios del 10 al 17, calcular todas las derivadas parciales de primer 
orden. En los ejercicios 10, 11 y 12 comprobar que las derivadas parciales mixtas DjDij) y 
D 2 (D,{) son iguales. 

10. f(x,y) = x 4 + y* - 4 x 2 y 2 . 14. f(x,y) = arctan (y/x), x ^ 0. 

11. f(x, y) = log (x 2 + y 2 ), (x, +) * (0, 0). 15. /(x, y) = arctan ~ +y , xy * 1. 

12- f(x,y) = -cosx 2 , y * 0. 16. f(x,y) = x'» 2 ’, x > 0. 

13. f(x,y) = tan (x 2 jý), y 0. 17. f(x,ý) = arccos yfxfy, y ^ 0. 
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18. Sea v(r,t) = t n e rì l Utì . Hallar un valor de la constante n tal que v satisfaga la siguiente 
ecuación: 

dv _ 1 d / ^ dv\ 
dt r 2 dr\ Srj 

19. Dadaz = u(x, y)e ax+bv y íVu/dx 3y) = 0. Hallar valores de las constantes a y b tales 
que 


3 2 z 3z 3z 

dxdy dx dy 2 

20. a) Suponer que f'(x\ ỳ)=. 0 para todo x en una cierta n-bola B(a) y para todo vector y. 
Utilizar el teorema del valor medio para demostrar que f es constante en B(a). 

b) Suponer que f' (x; y)= 0 para un vector fijo y y todo x en B(a). iQué puede decirse 
de / en este caso? 

21. Un conjunto S de R" se llama convexo si para todo par de puntos a y b de S 
el segmento de recta que une a con b pertenece también a S; dicho de otro modo, 
ta + (1 - t)b £ 5 para cada t del intervalo 0 < í < 1. 

a) Demostrar que toda n-bola es convexa. 

b) Si f'(x; y)= 0 para todo x en un conjunto convexo abierto S y todo y de R", de- 
mostrar que / es constante en S. 

22. a) Demostrar que no existe un campo escalar / tal que f'(a;y) > 0 para un vector 
fijo« y todo vector no nulo y. 

b) Dar un ejemplo de un campo escalar / talque/'(j^,y)>0 para un vector fijo y y todo 
vector x. 


8.10 Derivadas direccionales y continuidad 


En la teoría uni-dimensional, la existencia de la derivada de una función / 
en un punto implica la continuidad en aquel punto. Esto se demuestra fácilmente 
eligiendo un h ¥= 0 y escribiendo 


Ka + h) — f(à) = 


f(a + h) — f(a) h 


Cuando h 0 el segundo miembro tiende al límite f(a) • 0 = 0 y por tanto 
f(a + h) -> f(a). Esto prueba que la existencia de f(á) implica la continuidad de 
f en a. 

Supongamos que aplicamos el mismo razonamiento a. un campo escalar ge- 
neral. Supongamos que existe la derivada f'(a;y) para un cierto y. Entonces si 
h ¥= 0 podemos escribir 


/(a + hy) -/(«) 
h 


/(« + hy) -/(«) 
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Cuando h 0 el segundo miembro tiende al iímite f’(a;y)- 0 = 0; luego la 
existencia de f’(a;y) para un y dado implica que 

lim/(a + hy) =/(«) 

para el mismo y. Esto significa que f(x)->-f(a) cuando x -*■ a a lo largo de la 
recta de dirección y que pasa pora . Si f'(a;y) existe para todo vector y, entonces 
f(x) -*■ /(a)cuando x -*■ a a lo largo de toda recta que pase por a. Esto parece su- 
gerir que / es continua en a. Sin embargo, sorprende que esta conclusión no es 
necesariamente cierta. E1 ejemplo que sigue muestra un campo escalar que tiene 
derivada direccional en O en cualquier dirección pero que no es continuo en O. 

ejemplo. Sea / el campo escalar definido en R 2 del modo siguiente: 

f(x>y) = -rfi si *#o, /(o,y) = o. 

x + r 

Sea a = (0, 0) e y = (a, b) cualquier vector. Sia^Oy/z^O tenemos 

f(a + hy) - f(a) _ f(hý) - f(Q) _ f(ha, hb) _ ab 2 

h h h a 2 + hfb* ’ 

Haciendo que h -* 0 encontramos f'(0;ý) = b 2 /a. Si y = (0, b) encontramos, en 
forma parecida, que f'(0;ý) = 0. Por consiguiente f(0; y) existe para todas las 
direcciones .y. También, f(x) ->■ 0 cuando x->- O a lo largo de cualquier recta que 
pase por el origen. Sin embargo, en cada punto de la parábola x = y 2 (excepto 
en el origen) la función / tiene el valor £. Puesto que existen tales puntos tan 
próximos al origen como queramos y que f(O) = 0, la función / no es continua 
en O. 

E1 ejemplo anterior prueba que la existencia de todas las derivadas direccio- 
nales en un punto no implican la continuidad en él. Por esta razón, las deriva- 
das direccionales no constituyen una extensión satisfactoria del concepto uni- 
dimensional de derivada. Existe una generalización más conveniente que implica 
la continuidad y, al propio tiempo, nos permite extender los principales teoremas 
de la teoría de la derivación en una dimensión al caso de mayor número de 
dimensiones. Esa es la llamada diferencial total o simplemente diferencial. 

8.11 La diferencial 


Recordemos que en el caso uni-dimensional una función / que tiene deri- 
vada en a puede ser aproximada en un entomo de a mediante un polinomio de 
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Taylor de primer grado. Si existe f(a) designemos con E(a, h) la diferencia 


(8.6) £(„,») _/-(„) si h*0. 

y definamos E(a, 0) = 0. De (8.6) obtenemos la fórmula 
f(a + h) =f(a ) +f'(a)h + hE(a, h). 


válida también para h = 0. Ésta es la fórmula de Taylor de primer orden para 
aproximar f(a + h) — f(a) por medio de f(a)h. E1 error cometido es hE(a, h). 
De ( 8 . 6 ) resulta que E(a, h) -> 0 cuando h + 0. Por consiguiente el error hE(a, h) 
es de orden menor que h para valor pequenos de h. 

Esta propiedad de aproximar una función diferenciable mediante una fun- 
ción lineal sugiere un método de extender el concepto de diferenciabilidad al 
caso de un número cualquiera de dimensiones. 

Sea f: S -*■ R un campo escalar definido en un conjunto S de R\ Sean a 
un punto interior a S y B( a ; r) una n-bola contenida en S. Sea e un vector tal que 
||t»|| < r, de modo que a + re B(a; r). 

DEFINICIÓN DE CAMPO ESCALAR DIFERENCIABLE. DedmOS que f es dife- 
renciable en a si existe una transformación lineal 

T a : R" -► R 

de R” en R, y una función escalar E(a, v) tal que 

(8.7) f(a + v) =f(a) + T a (v) + ||»|| E(a, v), 

para ||e|| < r de manera que E(a, e) ->- 0 cuando\\\v\\^0.La transformación lineal 
T a se llama diferencial de f en a. 

Observación: La diferencial T. es una transformación lineal, no un número. 
E1 valor T„(e) es un número real; está definido para todo punto t> de R”. La dife- 
rencial fue introducida por W. H. Young en 1908 y por M. Fréchet en 1911 en forma 
más general. 

La ecuación (8.7), válida para ||e||<r, se llama fórmula de Taylor de 
primer orden para f(a + e). Nos proporciona una aproximación lineal, T a (v), para 
la diferencia f(a + e) - /(«). E1 error en la aproximación es ||e|| E(a, v), que es 
de orden más pequeno que ||e|| cuando ||e|| —► 0; esto es, E(a, v) = o(|| v\\) cuando 
NI-0. 



316 


Cálculo diferencial en campos escalares y vectoriales 


E1 teorema que sigue demuestra que si la diferencial existe, es única. Asi- 
mismo nos dice cómo calcular T a (y) para todo y de R”. 


teorema 8.5. Si f es diferenciable en a con diferencial T a , entonces existe 
la derivada f'(a;y ) para todo y de R“ y tenemos 

(8.8) T a (y)=f(a;y). 

Además, f(a;y) es una combinación lineal de los componentes dey. Efectiva - 
menie, si y =(y lt . . ., y n ), tenemos 

(8.9) /'(«î J') =2 DJ(a)y k . 

Demostración. La ecuación (8.8) es trivial si y = O puesto que T a (0) = 0 
y f(a;0) = 0. Por consiguiente podemos suponer que y ^ O. 

Puesto que / es diferenciable en a tenemos una fórmula de Taylor, 

(8.10) /(« + 9) -/(«) + T a (v) + ||v|| E(a, v) 


para ||t>|| < r para algún r > 0, y donde E(a, ») -> 0 cuando ||»|| -> 0. En esta 
fórmula tomemos v = hy, siendo h ¥= 0 y \h\ ||j’|| < r. Entonces ||»|| < r. 
Puesto que T a es lineal es T a (v) = T a (hy) = hT a (y). Por lo tanto (8.10) nos da 


( 8 . 11 ) 


f(a + hy) — f(a) 


= T a (y) + 


1*1 M 


E(a,v). 


Ya que ||v|| -» 0 cuando h 0 y ya que \h\/h = ±1, el segundo miembro de 
(8.11) tiende al límite T a (y) cuando h 0. Por consiguiente el primer miembro 
tiene el mismo límite. Esto demuestra (8.8). 

Para deducir (8.9) utilizamos la linealidad de T a . Si y = (y^,. .., y„) tene- 
mos y =2LiJA> lue g° 

T a (y) = T a (ïy^ k ) = ìy k T a (e k ) = ìyj’(a; e k ) = J y k DJ(a). 

\fc=i / t=i *=i *=i 


8.12 Gradiente de un campo escalar 

La fórmula del teorema 8.5, que expresa f(a;y) como una combinación 
lineal de los componentes de y , puede escribirse como un producto escalar, 

f(a;y) =ÎDJ(à)y k = Vf(a)y, 
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donde V/(a) es el vector cuyos componentes son las derivadas parciales de / en a, 
V/(a) = (DJia),..., DJ(a)). 


Este es el llamado gradiente de /. E1 gradiente V/ es un campo vectorial defmido 
en cada punto a en el que existen las derivadas parciales D,f(a),. . . , D n j(a). 
También empleamos la notación grad/ en lugar de V/. E1 símbolo V se lee 
«nabla». 

La fórmula de Taylor de primer orden (8.10) puede ahora escribirse en 
la forma 

(8.12) /(« + v) =/(«) + V/(a) • v + ||t>|| E(a, v), 

en donde E(a, v) 0 cuando ||»|| 0. En esta forma se parece a la fórmula de 

Taylor unidimensional desempenando el vector gradiente V/(a) el papel de la de- 
rivada f'(a).. 

A partir de la fórmula de Taylor podemos deducir fácilmente que la diferen- 
ciabilidad implica la continuidad. 

teorema 8.6. Si un campo escálar f es diferenciable en a, entonces f es con- 
tinua en a. 

Demostración. De (8.12) resulta 

I/(« + «0 -/(«)I = |V/(«) -»+«»11 E(a, »)|. 

Aplicando la desigualdad triangular y la de Cauchy-Schvvarz encontramos 
0 ^ I/(« + v) - f(a)\ <, ||V/(«)|| ||»11 + ||»|| \E(a, »)|. 



el componente 
de lf(a) a lo largo del vector unitario 


Figura 8.5 Relacîón geométrica de la derivada direccional con el vector gradiente. 
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Esto demuestra que f(a + »)->-/(«) cuando ||»|| -*-0, así que /es continua en a. 

Cuando y es un vector unitario la derivada direccionai f'(a;y) tiene una sen- 
cilla relación geométrica con el vector gradiente. Supongamos que V/(a) ^ O 
y designemos con 6 el ángulo formado por V/(«) ey. Tenemos entonces 


f'(a;ý) = V/(a) • y = ||V/(a)||||j;|| cos 6 = ||V/(a)|| cos 0. 


Esto nos dice que la derivada direccional es el componente del vector gradiente 
en la dirección del j>. La figura 8.5 muestra los vectores V/(a) e y aplicados al 
punto a. La derivada alcanza el valor máximo cuando cos 8 = 1, esto es, cuando 
y tiene la misma dirección que V/(a). Además, este máximo es igual a la longi- 
tud del vector gradiente. Cuando V/(«) es ortogonal a y, la derivada direccional 
/'(a; j>)es 0. En el espacio de dos dimensiones se escribe con frecuencia 


V/(x, j;) = 


df(x,y) df(x,y) . 
dx dy J 


En tres dimensiones la fórmula correspondiente es 


ox oy oz 


8.13 Condición suficiente de diferenciabilidad 

Si / es diferenciable en a, existen todas las derivadas parciales DJ(a) . 

D n f( a )~ No obstante, la existencia de todas esas derivadas no implica necesaria- 
mente que / sea diferenciable en a. La siguiente función proporciona un contra- 
ejemplo 


f(x, y) = ~ y si xjíQ, f(0,y) = 0, 
xr + / 

que ya se discutió en la sección 8.10. Para esa función existen las dos derivadas 
parciales Df(O) y D;J(0) pero / no es continua en O, y por tanto no puede 
ser diferenciable en O. 

E1 teorema que sigue demuestra que la existencia de derivadas parciales 
continuas en un punto implica la diferenciabilidad en dicho punto. 

TEOREMA 8.7. CONDICIÓN SUFICIENTE DE DIFERENCIABILIDAD. Si eXÌSten 
las derivadas parciales Df, ...,D„f en una cierta n-bola B(a) y son continuas 
en a, entonces f es diferenciable en u. 
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Observacìón: Un campo escalar que satisfaga las hipòtesis 8.7 se le llama 
diferenciable con continuidad en a. 

Demostración. T a (») sólo puede ser Vf(a) ■ v . Queremos demostrar que 

f(a + v) — f(a) = V/(«) • r + ||»|| E(a, v), 

donde E(a, v) -* 0 cuando ||»|| -* 0. Esto probará el teorema. 

Pongamos X = ||»||. Entonces v = Xu, donde ||«|| = 1. Mantengamos \ lo 
bastante pequeno para que a + v esté en la bola B(a) en la que existen las deri- 
vadas parciales Df ,.... D„f. Expresando u en función de sus componentes 
tenemos 


u = tqtq + • • • + u n e„, 

donde e 1 ,...,e n son los vectores coordenados unitarios. Escribamos ahora la di- 
ferencia f(a + v) — f(a) en forma de suma telescópica, 


(8.13) f(a + ») - f(a) = /(« + A«) - /(«) = f {/(« + Ar fc ) - /(« + *»*_,)}, 


en la que » 0 ,v lt ..., v„ son vectores cualesquiera de R" tales que v 0 = O y v n = u. 
Elijamos esos vectores de modo que satisfagan la relación de recurrencia 
v k = v k-i + u k e k . Esto es, tomemos 

. »0 = O, V 2 = U l e l + U &’ ■ ■ ■ ’ v n = u i e i + • • • + u„e„. 

Entonces el fc-ésimo término de la suma (8.13) se transforma en 

/(« + ÂtVi + Xu k e k ) — f(a + Xv^) =f(b k + Xu k e k ) —f(b k ), 

donde b k = a + Xv^. Los dos puntos b k y b k + Xu k e k tan sólo difieren en su 
fc-ésimo componente. Por consiguiente podemos aplicar el teorema del valor 
medio del cálculo diferencial y escribir 

18.14) f(b k + Xu k e k ) -f(b k ) = Xu k D k f(c k ), 

perteneciendo c k al segmento de recta que une b k a b k + Xu k e k . Obsérvese que 
b k -* a y por tanto c k -+a cuando A -> 0. 

Aplicando (8.14) en (8.13) obtenemos 


/(« + v) -/(«) = XjD k f(c k )u k . 
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Pero V/(«) • v = A V/(a) • u = A D k f(a)u k , así que 

/(« + v ) — /(«) - V/(a) ■ i> = 2Ì{^/(c t ) - D k f(à)}u k = ||i>|| £(a, v), 

donde 

£(a, ®) =îjD k f(c k ) - D k f(a)}u k . 


Puesto que c k --a cuando ||v|| -*■ 0, y puesto que cada derivada parcial Dkf es 
continua en a„ vemos que E(a, v) -> 0 cuando ||®||| _> 0. Esto completa la delmos[- 
tración. 

8.14 Ejercicios 


1. Hallar el vector gradiente en cada punto en el que exista para los campos escalares de- 
íìnidos por las ecuaciones siguientes: 

a) f(x, y) - x 2 + y* sen (xy) . d) f(x, y, z) = x 2 - y 2 + 2z a . 

b) f(x, y) = e* cos y. e) f(x, y, z) = log (x 2 + 2 y 2 - 3z 2 ). 

c) f(x, y, z) = xyz* . f) f(x, y, z) = *»* . 

2. Calcular las derivadas direccionales de los siguientes campos escalares en los puntos 
y direclciones que se indican: 

a) f(x,y,z) = x 2 + 2f + 3Z 2 en (1,1,0) en la dirección de / -j + 2 k. 

b) f(x, y, z) = (x/y)' en (1,1,1) en Ia dirección de 2 i +j - k. 

3. Hallar los puntos (x,y) y las direcciones para Ias que la derivada direccional de 
f(x,y) = 3x J + y 2 tiene el valor máximo, si (x,y) está efi el círculo x 2 + ý = 1. 

4. Un campo escalar diferenciable f tiene, en el punto (1,2) las derivadas direccionales 
+2 en dirección al punto (2,2) y —2 en dirección al punto (1,1). Determinar el vector 
gradiente en (1,2) y calcular la derivada direccional en dirección al punto (4,6). 

5. Hallar los valores de las constantes a, b y c tales que la derivada direccional de 
f(Xj y, z) = axy 2 + byz + cz 2 x 3 en el punto (1,2,—1) tenga el valor máximo 64 en la 
dirección paralela al eje z. 

6. Dado un campo escalar diferenciable en un punto a de R z . Supongamos que f' (a; ý)= 1 
y /' («; z) =2, siendo v = 2/ + 3j y z = i + j. Hacer un gráfico mostrando el conjunto 
de todos los puntos (x,y) para los que f'(a;xi + yj) = 6. Calcular también el gra- 
diente V/(«). 

7. Sean / y g dos campos escalares diferenciables en un conjunto abierto S. Deducir las 
siguientes propiedades del gradiente: 

a) grad / = O si / es constante en S. 

b) grad (/ + g) = grad / + grad g. 

c) grad (cf) = c grad / si c es constante. 

d) grad (/g) = / grad g + g grad /. 

e) grad = <f g rad /^/g rad ff en j os puntos en j os que g 0 . 

8. En R 3 consideremos r(x,y,z) = xi + yj + zk, y sea r(x,y,z) = \\r(x,y, z)|| . 
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a) Demostrar que V r(x, y, z) es un vector unidad en la dirección de r (x, y, z). 

b) Demostrar que V ( r ’) = nr*~ 2 r si n es un entero positivo. 

[ Indicación: Utilizar el ejercicio 7 d).] 

c) í,Es válida la fórmula del apartado b) cuando n es entero negativo o cero? 

d) Hallar un campo escalar f tal que V/ = r. 

9. Supongamos que / es diferenciable en cada punto de una n-bola B(a). Si /' (x; y) =0 

para n vectores independientes ^.;,y para todo x en B(a), demostrar que / es 

constante en B(a). 

10. Supongamos que / es diferenciable en cada punto de una n-bola B(a). 

a) Si V/(x) = O para todo x de B(a), demostrar que / es constante en B(a). 

b) Si f(x) < f(a) para todo x de B(a), demostrar que V/(«) = O. 

11. Considerar las seis proposiciones que siguen relativas a un campo escalar /:S —> R, siendo 
S £ R" y a un punto interior a S. 

a) / es continuo en a. 

b) / es diferenciable en «. 

c) f' (a\y) existe para todo y de R\ 

d) Existen todas las derivadas parciales de / en un entomo de « y son continuas en «. 

e) V/(a) = O. 

f) f(x) = ||x — «|| para todo x de R\ 


En una tabla parecida a la indicada aquí, 
marcar con una T el cuadrado correspondiente 
si la proposición de la fila (x) implica siempre 
la proposición de la columna (y). Por ejemplo, 
si (a) implica siempre (b), poner T en el se- 
gundo cuadrado de la primera fìla. La diagonal 
principal ha sido ya marcada. 



8.15 Regla de la cadena para derivadas de campos escalares 

En la teoría de la derivación en una dimensión, la regla de la cadena nos 
permite calcular la derivada de una función compuesta g(t) = f[r(t )] mediante 
la fórmula 

g'(t)=f'[r(t)]-r'(t). 

Esta sección nos proporciona una extensión de la fórmula cuando / se reemplaza 
por un campo escalar definido en un conjunto del espacio de dimensión n, y r 
por una función vectorial de una variable real cuyos valores están en el domi- 
nio de /. 
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Más adelante extenderemos aún más la fórmula para incluir el caso en el 
que / y r son ambas campos vectoriales. 

Resulta fácil imaginarse casos en los que puede presentarse la composición 
de un campo escalar y un campo vectorial. Por ejemplo, supongamos que f(x) 
mide la temperatura en un punto x de un sólido tri-dimensional, y supongamos 
que queremos conocer cómo cambia la temperatura cuando el punto x se mueve 
a lo largo de una curva C situada en el sólido. Si la curva es descrita por una 
función vectorial r definida en un intervalo [a, b), podemos introducir una 
nueva función g mediante la fórmula 

g(0 =/W)] si a<t<b. 

Esta función compuesta g expresa la temperatura como función del parámetro 
t, y su derivada g'(f) mide la variación de la temperatura a lo largo de la curva. 
La siguiènte extensión de la regla de la cadena nos permite calcular la derívada 
g'(f) sin determinar g(t) explícitamente. 

teorema 8.8. regla de la cadena. Sea j un campo escalar definido en 
en un conjunto abierto S de R n , y sea r una función vectorial que aplica un 
intervalo / de R 1 en S. Dejinamos la función compuesta g =f ° r en J mediante 
la ecuación 


g(0=f[r(t)] si teJ. 

Sea t un punto de / en el que r'(t) existe y supongamos que f es diferenciable en 
r(t). Existe entonces g'(t) y es igual al producto escalar 

(8.15) g'(t) = V/(«) • r’(t), donde a = r(t). 

Demostración. Pongamos a = r(t), siendo t un punto de / en el que 
r'(t) exista. Puesto que S es abierto existe una «-bola B(a) situada en S. Tomemos 
h ¥=■ 0 lo bastante pequeno para que r(t + h) esté situada en B(a), y pongamos 
y = r(t + h) — r(t) . Obsérvese que y—*0 cuando h -* 0. Tenemos ahora 

g(t + h) - g(t) =f[r(t + h)] — f[r(t)] =f(a + y) -/(«). 

Aplicando la fórmula de Taylor de primer orden a / tenemos 
/(« + y) -/(«> = V/(«) • y + \\y\\ E(a, y), 
donde E(a,y)->- 0 cuando |bl| -»-0. Ya que+' = r(t + h) — r(í)esto nos da 

+ _ v/(«). ’áí+JthlM + IK«+*)-K0l . 

h h h 
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Haciendo que h 0 obtenemos (8.15). 

ejemplo 1. Derivada direccional a lo largo de una curva. Cuando la fun- 
ción r describe una curva C, la derivada r' es el vector velocidad (tangente a 
la curva) y la derivada g' de la ecuación (8.15) es la derivada de / respecto al 
vector velocidad, suponiendo que r' O. Si T(t) es un vector unitario en la 
dirección de r'(t) (T es el vector tangente unitario), el producto escalar 
y/[r(í)] • T(t) se llama derivada direccional de f a lo largo de la curva C o en la 
dirección de C. Para una curva plana podemos escribir 

T(t) = cos a(í) í + cos / 6(t) j, 

siendo a(t) y /3(f) los ángulos formados por el vector T(t) y los ejes x e y posi- 
tivos; la derivada direccional de f a lo largo de C es en este caso 

V/[r(r)] • T(t) = DJ[r(t)} cos « (t) + D 2 f[r(t )] cos fi(t). 

Con frecuencia esta fórmula se escribe más simplemente así: 

V/- T = — cos a + — cos /3. 
ox dy 

Algunos autores expresan la derivada direccional Vf T.con el símbolo df/ds. 
Puesto que la derivada direccional a lo largo de C está defmida en función de T, 
su valor depende de la representación paramétrica elegida para C. Un cambio de 
la representación podría invertir la dirección de T; lo que, a su vez, invertirá 
el signo de la derivada direccional. 

ejemplo 2. Hallar la derivada direccional del campo escalar f(x, y) = 
= x 2 - 3xy a lo largo de la parábola y = x 2 — x + 2 en el punto (1,2). 

Solución. En un punto cualquiera (*, y) el vector gradiente es 

V/(x, y) = &i + = (2* - 3 y)i - 3 xj. 

dx dy 

En el punto (1,2) tenemos V/(l,2) = —41' — 3 j. La parábola puede represen- 
tarse paramétricamente mediante la ecuación vectorial r(t) = ti + (t 2 — t + 2)j. 
P°r lo tanto, r(l) = i + 2/, r'(t) = i + (2 1 - 1 )j,y r'(l) = / + y.Para esta re- 
presentación de C el vector unitario tangente T (1) es (í + j)j\/2 y la derivada di- 
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reccional pedida es V/(l,2) • 7(1) = —7/V2. 

ejemplo 3. Sean / un campo escalar no constante, diferenciable en todo 
el plano, y c una constante. Supongamos que la ecuación cartesiana f(x, y ) = c 
describa una curva C que tenga tangente en cada uno de sus puntos. Demostrar 
que / tiene las siguientes propiedades en cada punto de C: 

a) E1 vector gradiente V/ es normal a C. 

b) La derivada direccional de / es cero a lo largo de C. 

c) La derivada direccional de / tiene su valor máximo en la dirección 
normal a C. 

Solución. Si T es un vector unitario tangente a C, la derivada direccional 
de / a lo largo de C es el producto escalar V/- T. Este producto es cero si 
V/ es perpendicular a T, y alcanza su tnáximo valor si V/ es paralela a T. 
Por consiguiente las dos proposiciones b) y c) son consecuencias de a). Para 
demostrar a), consideremos una curva plana cualquiera r con una ecuación vec- 
torial de la forma r(t) =X(t)i + Y(t)j e introduzcamos la función g(t) =f[r(tj\. 
En virtud de la regla de la cadena tenemos g'(t) = V/[r(í)] ■r'(t). Cuando r = C, 
la función g tiene el valor constante c así que g'(t) = 0 si r(t) e C. Puesto que 
g' = V/- r',resulta que V/ es perpendicular a r' en C; luego V/ es normal a C. 

8.16 Aplicaciones geométricas. Conjuntos de nivel. Planos tangentes 

La regla de la cadena puede utilizarse para deducir propiedades geométricas 




Figura 8.6 Las curvas de trazos son iso- Figura 8.7 El vector gradiente V/ es 
termas: j(x, y) = c. El vector gradiente V/ normal a cada curva T situada en la super- 
indica la dirección de las líneas de fuerza. ficie de nivel j(x, y, z) = c. 
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del vector gradiente. Sea / un campo escalar definido en un conjunto S de R’* y 
consideremos aquellos puntos jc de S para los que f(x) tiene un valor constante, 
por ejemplo f(x) = c. Designemos ese conjunto por L(c), de modo que 

L(c) = (j: | x e S y f(x) = c}. 

E1 conjunto L(c) se llama conjunto de nivel de /. En R 2 , L(c) se llama curva de 
nivel; en R :t superficie de nivel. 

En muchas aplicaciones físicas se presentan familias de curvas de nivel. Por 
ejemplo, si f(x, y) representa la temperatura en (x,y), las curvas de nivel de / 
(curvas de temperatura constante) se llaman isotermas. E1 flujo de calor tiene 
lugar en la dirección del cambio más rápido de la temperatura. Luego, en una 
hoja plana delgada el flujo de calor tiene lugar a Io largo de una familia de curvas 
ortogonales a las isotermas. Esas se llaman líneas de flujo; son las trayectorias 
ortogonales de las isotermas. Véase la figura 8.6. 

Consideremos ahora un campo escalar / diferenciable en un conjunto abierto 
S de R a , y examinemos una de sus superfiçies de nivel, L(c). Sea a un punto 
en esa superficie, y consideremos una curva r situada en la superficie y que pase 
por a, como está indicado en la figura 8.7. Demostraremos que el vector gradiente 



Figura 8.8 El vector gradiente V/ es normal al plano tangenle a una superficie de nivel 
f(x,y,z) = c. 
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V f(a) es normal a esa curva en a. Esto es, demostraremos que V f(à) es perpen- 
dicular al vector tangente de r en a. A tal fin supongamos que r está defmida para- 
métricamente por una función vectorial derivable r definida en un cierto inter- 
valo / de R 1 . Puesto que r está situada en la superfìcie de nivel L(c), la función r 
satisface la ecuación 


/[r(/)] = c para todo tàeJ. 

Si g(t) = f[r(t)\ para t en /, la regla de la cadena establece que 
í'(0 = V/[r(0]-r'(í). 

Puesto que g es constante en /, tenemos g'fO = 0 en /. En particular, eligiendo U 
de modo que g(t x ) = a encontramos que 

V/(«) ■ r'(0) = 0. 

Es decir, el gradiente de / en a es perpendicular al vector tangente r'(f) como se 
afirmó. 

Tomemos ahora una familia de curvas en la superficie de nivel L(c) que pasen 
por el punto a. Según lo dicho en la discusión anterior, los vectores tangentes a 
todas esas curvas son perpendiculares al vector gradiente V/(a) . Si éste no es cero, 
dichos vectores tangentes determinan un plano, y el gradiente V/(a) es normal a 
este plano. (Véase figura 8.8.) Tal plano se llama plano tangente a la superficie 
L(c) en a. 

En el Volumen I se vio que un plano que pase por a con vector normal N 
está constituido por lodos los puntos x de R 3 que satisfacen la ecuación 
N ■ (x — a) = 0. Por consiguiente el plano tangente a la superficie de nivel L(c) 
en a estará constituido por todos los puntcs x de R 3 que satisfagan 

V/(a) • ( x - a) = 0 . 

Para obtener úna ecuación cartesiana de ese plano expresaremos x, a, y V/(a) 
en función de sus componentes. Escribiendo x = (x, y, z), a = (x,, y,, z,), y 

V/(a) = D y f(à)i + D 2 f(a)j + D a f(a)k , 


obtenemos la ecuación cartesiana 

A/(«)(* “ *i) + D 2 f(a)(y - yf) + D a f(a)(z - z a ) = 0. 
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A los campos escalares definidos en R 2 se aplica una discusión parecida. En el 
ejemplo 3 de la sección anterior hemos demostrado que el vector gradiente V/(a) 
en un punto a de una curva de nivel es perpendicular al vector tangente a la 
curva en a. Por consiguiente la recta tangenle a la curva de nivel L(c) en un punto 
a = (*!, j x ) tiene la ecuación cartesiana 

L>if(a)(x - xj) + D 2 f(a)(y - /0 = 0. 


8.17 Ejercicios 


1. En este ejercicio podemos suponer la existencia y continuidad de todas las derivadas 
que se consideren. Las ecuaciones u=f(x,y), x=X(t), y=Y(t) definen u como función 
de t, pongamos u=F(t). 

a) Aplicar la regla de la cadena para demostrar que 

rto + l'm 

donde df/dx y df/dy se han calculado en [X(í). V(í) ]. 

b) En forma parecida, expresar la derivada segunda F"(t) en función de las derivadas 

de /, X e Y. Recuérdese que las derivadas parciales de la fórmula del apartado a) son 

funciones compuestas dadas por 

f x = D ifW’ y (')]. Y y = noi. 

2. Teniendo en cuenta el ejercicio 1 calcular F'(t) y F”(t) en función de t en cada uno de 
los siguientes casos particulares: 

a) f(x,y) = x 2 + yf X(t) = /, Y(t) = /«. 

b) f(x, y) = é™ cos (xy 2 ), X(t) = cos t, Y(t) = sen t. 

c) f(x,y) = log [(1 + f* 2 )/(l + «»*)], X(t) = e, Y(t)* = e"'. 

3. Calcular en cada caso la derivada direccional de / en los puntos y direcciones que se 
indican: 

a ) f(x,y,z)=3x — 5y + 2z en (2,2,1) en la dirección de la normal exterior a la 
esfera + + y 2 + z 2 = 9. 

b) f(x, y, z) = x 2 - y 2 en un punto cualquiera de la superficie x 2 + y J + z 2 = 4 en la 
dirección de la normal exterior en dicho punto. 

c) f(x, y,z) = x 2 + y 2 — z 2 en (3,4,5) a lo largo de la curva de intersección de las dos 
superficies 2x 2 + 2ý — z 2 = 25 y x 1 + ý = z 2 . 

4. a) Hallar un vector V(x, y, z) normal a la superficie 


Z = yjx 2 + / + (X 2 + ffí 
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en un punto cualquiera (x, y, z) de la superficìe (x, y, z) ^ (0, 0, 0). 

b) Hallar el coseno del ángulo ® formado por eí vector y(x,y,z) y el eje z y deter- 

minar el límite de cos 6 cuando (x, y, z) —> (0,0,0). 

5. Las dos ecuaciones e‘ cos v = x y e* sen v = y definen u y v como funciones de x e y, 
sean éstas u = U(x, y) y v = V(x, y). Hallar fórmulas explícitas para U(x, y) y V(x,y), 
válidas para x > 0, y demostrar que los vectores gradientes VU(x,y) y V V(x, y) son 
perpendiculares encada punto (x, y). 

6. Sea /(x,_y) = VRŷT- 

a) Comprobar que df/dx y 'àf/'ày son cero ambas en el origen. 

b) ^Tiene la superficie z = f(x,y) plano tangente en el origen? [ Indicación : Considé- 
rese la sección producida en la superficie por el plano x =y.] 

7. Si (xo, yo, zo) es un punto de Ia superficie z = xy, las dos rectas z = yox, y = yo y 
z = xoy, x = xo se cortan en (xq, yo, zo) y están situadas en la superficie. Comprobar que 
el plano tangente a esta superficie en el punto (*o, yo, z o) contiene a esas dos rectas. 

8. Hallar la ecuación cartesiana del plano tangente a la superficie xyz = áf en un punto 
genérico (xo.yo, zo). Demostrar que el volumen del tetraedro limitado por ese plano y 
Ios tres planos coordenados es 9a s /2. 

9. Hallar un par de ecuaciones cartesianas para la recta que es tangente a las dos super- 
ficies x 2 + y 2 + 2z 2 = 4 y z = e*~ v en el punto (1,1,1). 

10. Hallar una constante c tal que en todo punto de la intersección de las dos esferas 

(x -cf + f +z 2 = 3 y x 2 + (y - l) a + z 2 = 1 

los planos tangentes correspondientes sean perpendiculares el uno al otro. 

11. Si T\ y r 2 son las distancias desde un punto (x,y) de una elipse a sus focos, demostrar 
que la ecuación n + n = constante (que satisfacen esas distancias) implica la relación 

T V(n + r 2 ) = 0, 

siendo T el vector unitario tangente a la curva. Interpretar geométricamente ese resul- 
tado, y con ello demostrar que la tangente forma ángulos iguales con las rectas que 
unen (x,y) a los focos. 

12. Si V f(x, y, z) es siempre paralela a xi + yj + zk , demostrar que / debe tomar valores 
iguales en los puntos (0,0, a) y (0,0, —a). 


8.18 Diferenciales de campos vectoriales 

La teoría de la diferenciación para campos vectoriales es una extensión directa 
de la teoría análoga para campos escalares. Sea /: S -> R m un campo vectorial 
definido en un subconjunto S de R n . Si a es un punto interior de S e y un vector 
cualquiera de R” definimos la derivada /'(«; y) mediante la fórmula 

/•(.;,) ~/M, 

ft-o h 

siempre que tal límite exista. La derivada f'(a; y)es un vector de R m . 
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Designemos con f k el fc-ésimo componente de /. Observemos que la derivada 
f («,' j)existe si y sólo si f' k ( a;y) existe para cada k = 1,2 ,,m, en cuyo caso 
tenemos 


f'(«\y) = (fí(a;y),... ,f'Ja\ỳ)) =J,fí(a;ỳ)e k , 

donde e k es el A;-ésimo vector coordenado unidad. 

Decimos que / es diferenciable en un punto interior a si existe una transfor- 
mación lineal 


T a : R” —*• R m 

tal que 

(8-16) f(a + v) = /(«) + T a (v) + || v || E(a, v), 

áondeE(a, v) -*■ Ocuando v-*- O. La fórmula de Taylor de primer orden (8.16) es 
válida para todo v tal que ||t>|| < r para un cierto r > 0. E1 término E(a, v) es un 
vector de R m . La transformación lineal T a se llama diferencial total o simple- 
mente diferencial de / en a. 

Para los campos escalares se demostró que T a (ỳ) es el producto escalar del 
vector gradiente V/(«) por y. Para los campos vectoriales demostraremos que 
T a (y) es un vector cuyo componente A:-ésimo es el producto escalar V/^(a) • y. 

teorema 8.9. Supongamos que f es diferenciable en a con diferencial T a . 
Existe entonces la derivada f(a;y)para todo a de R”, y tenemos 

( 8 .1 7 ) T a (y)=f(a;ý). 

Además, si f = (f lt ... ,f m ) y si y = (y x ,..., y„), tenemos 

(8.18) T a (y) = f Vf k (a) ye k = (Vffa) ■ y,. . . , V/ m («) • y). 

Demostración. Razonemos como en el caso escalar. Si y = O, entonces 
f'(a;ỳ) = O y T 0 (0) = O. Por consiguiente podemos suponer que y ^ O. To- 
mando v = hy en la fórmula de Taylor (8.16) tenemos 

/(« + hy) -/(«) = T a (hy) + ||hy || E(a, v) = hT a (y) + \h\ ]|y|| E(a, v). 

Dividiendo por h y haciendo que h -» 0 obtenemos (8.17). 

Para demostrar (8.18) basta observar que 

f(a; y) f k (a; y)e k = | V f k (a) ye k . 
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La ecuación (8.18) puede también escribirse en forma más sencilla como un 
producto matricial. 


TJy) = Df{a)y, 


siendo Df(á) \ a matriz mXn cuya fila fc-ésima es Vfja), e y una matriz columna 
nXl. La matriz Df(a) se llama matriz jacobiana de'/ en a. Su elemento kj es la 
derivada parcial D f f k (a). Así pues, tenemos 


-DJJa) DJJa) ■■■ DJJa) 
DJJa) DJJa) ■■■ DJJa) 


Df(a) = 


PJ m (a) DJ m (a) ■■■ DJ m (a )J 


La matriz jacobiana Df(a) está defìnida en cada punto en el que existan las mn 
derivadas parciales D f f k (a). 

La diferencial T a se expresa también poniendo f'(a). La derivada f'(a) es 
una transformación lineal; la matriz jacobiana Df(a) es una representación ma- 
tricial de esa transformación. 

La fórmula de Taylor de primer orden toma la forma 


(8.19) /(« + ») =/(«) +/'(«)(») + II »11 E(a, v), 

donde E(a, v) -> O cuando »->(?. Se parece a la fórmula de Taylor unidimensio- 
nal. Para calcular los componentes del vector /'(«)(») podemos utilizar el produc- 
to matricial Df(a)v o la fórmula (8.18) del teorema 8.9. 

8.19 La diferenciabilidad implica la continuidad 

teorema 8.10. Si un campo vectorial f es diferenciable en a, entonces f es 
continuo en a. 

Demostración. Como en el caso escalar, aplicamos la fórmula de Taylor 
para demostrar este teorema. Si hacemos que v -*■ O en (8.19) el error 
V | E(a, v) -> O. La parte lineal /'(«)(») tiende también a O debido a que las 
transformaciones lineales son continuas en O. Esto completa la demostración. 

A1 llegar aquí conviene deducir una desigualdad que se utilizará en la de- 
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mostración de la regla de la cadena en la próxima sección. La desigualdad se re- 
fìere a un campo vectorial / diferenciable en «; ella establece que 

(8.20) ll/'(«)(»)ll < M/a) ||t-|l, donde M,(a) = Jj|V/,(«)||. 

Para demostrarla utilizamos la ecuación (8.18) junto a la desigualdad triangular 
de Cauchy-Schwarz obteniendo 

ll/'(«X»)H = | ÏWÁà) ve k | <||VA(«) • »| < I ||V/ fc («)|| ||»||. 


8.20 La regla de la cadena para diferenciales de campos vectoriales 

teorema 8.11. regla de la cadena. Sean f y g dos campos vectoriales 
tales que la función compuesta h =f ° g esté definida en un entorno del punto a. 
Supongamos que g sea diferenciable en a, con diferencial g'(a). Pongamos b = g(a) 
y supongamos que f es diferenciable en b, con diferencial f'(b). Entonces h es 
diferenciable en a, y la diferencial h'(a) viene dada por 

h'(á)=f'(b)o g '(a), 

que es la composición de las transformaciones lineales f'(b) y g’(a). 

Demostración. Consideremos la diferencia h(a + y) — A(«)para valores pe- 
quenos de ||j|[, y demostremos que se obtiene una fórmula de Taylor de primer 
orden. De la defìnición de h resulta 

(8.21) *(« +y)~ A(«) =f\g(a + jO] -/[«(«)] =f(J> + ») -/(*), 

siendo v = g(a + j) — g(a). La fórmula de Taylor aplicada a g(a + y) 
nos da 

(8.22) v = g'(a)(y) + ||j>|[ E g (a, y), donde E g (a, y)^0 cuando y -> O. 

La fórmula de Taylor relativa a f(b + »)nos da 


(8.23) 


f(b + v) -f(b) =f’(b)(v) + H| E f (b, v). 
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donde E f (b, v) -* O cuando v -> O. Aplicando (8.22) en (8.23) obtenemos 

(8.24) f(b + v) -f(b) =f'(b)g'(a)(y) +/'(*)(||j>|| E g (a,y)) + \\v\\ E f (b, v) 

=f\b)g'(a)(y) + \\y\\ E(a,y), 

donde£(a, O) = O y 

(8.25) E(a,y) = f’(b)(E g (a,y)) + E f (b, v) si y^O. 

Para completar la demostración necesitamos probar queE(a, y) —*■ O cuando y —*■ O. 

E1 primer término del segundo miembro de (8.25) tiende a O cuando y -*■ O 
porque E g (a,y)^* 0 cuandc O y las transformaciones lineales son continuas 

en O. . 

En el segundo término del segundo miembro de (8.25) el îactor E f (b, v) -*• O 
porque v ->■ O cuando y-* O. E1 cociente ||»||/||y|| permanece acotado porque, 
según (8.22) y (8.20) tenemos 

IU’11 <,M g (a)\\y\\ + ||j>|| ||£’ < («,y)||. 

Por consiguiente los dos términos del segundo miembro de (8.25) tienden a O 
cuando y -*■ O , así que E(a, ý) -+■ O . 

De este modo, de (8.24) y (8.21) obtenemos la fórmula de Taylor 

h(a +y)~ h(a) =f'(b)g'(a)(ý) + ||j;|| E(a, y), 

dond eE(a,y)~* O cuando y^O. Esto demuestra que h es diferenciable en a 
y que la diferencial h'(a) es igual a la composición f'(b) ° g'(a). 

8.21 Forma matricial de la regla de la cadena 

Sea h = /° g, donde g es diferenciable en a y / diferenciable en b =g(a). 
La regla de la cadena establece que 

*'(«) =f'(b)°g'(a). 

Podemos expresar la regla de la cadena en función de las matrices jacobianas 
Dh(a), Df(b), y Dg(a) que representan las transformaciones lineales h'(a), f'(b), 
y g'(a), respectivamente. Puesto que la composición de transformaciones lineales 
corresponde a la multiplicación de sus matrices, obtenemos 


( 8 . 26 ) 


Dh(a) = Df(b) Dg(a), donde b = g(a). 
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Ésta es la llamada forma matricial de la regla de la cadena. También puede es- 
críbirse como un conjunto de ecuaciones escalares expresando cada matriz en 
función de sus elementos. 

Supongamos que a e R p , 6 = g(à) e R", y f(b) e R m . Entonces h(a) e R m y 
podemos escribir 

g = (gu---,gn), f=(Á,...,f m ), h = (h u . .. , h m ). 

La matriz Dh(a) es mXp, la matriz Df(b) es mXn, y Dg(a) es una matriz 
nXp, y vienen dadas por 

Dh(a) = [DM«)]7jíi, Df(b) = [DjmZh, Dg(a) = [D jgk (a)t.li. 

La ecuación matricial (8.26) es equivalente a mp ecuaciones escalares. 


DM«) = î D k fi(b)D jgk (a), para i = 1, 2,..., m y j = 1, 2, . . . , p. 

k=l 


Estas ecuaciones expresan las derivadas parciales de los componentes de h en 
función de las derivadas parciales de los componentes de / y g. 

ejemplo 1. Extensión de la regla de la cadena para campos escalares. 
Supongamos que / es un campo escalar (m = 1). Entonces h también lo es y 
existen p ecuaciones en la regla de la cadena, una para cada una de las derivadas 
parciales de h: 


D M a ) = ỳ.DJ(b)D jgk (a) , para j = 1 , 2,. . ., p . 


E1 caso particular p = 1 ya se consideró en la sección 8.15. Entonces se tiene la 
única ecuación. 


h'( a )=J.DJ(b)g' k (a). 


Consideremos ahora p = 2 y n = 2. Pongamos a = (s, t) y b = (x, y). Los 
componentes x e y están ligados a s y t por las ecuaciones 


x=gi(s,t), y = g 2 (s, t). 
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La regla de la cadena nos da un par de ecuaciones para las derivadas parciales 
de h: 


DMs, t ) = DJ(x,y) D&fs, 0 + DJ(x,y) D^s, t), 

D 2 h(s, t) = DJ(x,y) DgM, 0 + DJ(x,y) D 2 g 2 (s, t). 

Empleando el signo 0, también se pone este par de ecuaciones en la forma 

( 8 27 ) d — = ^ ~ — = + Èfdy 

ds dx ds dy ds ' dt dx dt dy dt 


ejemplo 2. Coordenadas polares. La temperatura de una placa delgada 
se representa por un campo escalar f, siendo f(x,y) la temperatura en (x, y). 
Introduciendo las coordenadas polares x = r cos 0, y = r sen 6, la temperatura se 
convierte en una función de r y 6 determinada por medio de la ecuación 

<p(r, 0) —f(r cos 0, r sen 0). 

Expresar las derivadas parciales d<p/dr y d<p/dd en función de las derivadas par- 
ciales df/dx y df/dy. 


Solución. Utilicemos la regla de la cadena en la forma (8.27), poniendo 
(r, &) en lugar de (s, t), y <p en lugar de h. Las ecuaciones 


dx „ dv dx 

— = cosd, — = sen 6, — =-rsen(9 

or dr BO 

Sustituyendo esas fórmulas en (8.27) obtenemos 


_ 


òx òy 

Éstas son las fórmulas pedidas correspondientes a d<pjdr y dcp/dO. 


(8.28) + ^ 
òr òx dy 


d<p <>f df 

— = -r — senfl + r cos 6. 
oO ox dy 


ejemplo 3. Derivadas parciales de segundo orden. Continuando el ejem- 
plo 2, expresar la derivada parcial de segundo orden d 2 <pfd6 2 en función de las 
derivadas parciales de f. 


Solución. Comencemos con la fórmula que da d<p/dO en (8.28) y derivemos 
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respecto a 0, considerando r como una constante. En el segundo miembro hay 
dos términos, cada uno de los cuales debe derivarse como producto. Obtenemos 
así 


df d(senO) _ 


,nem\ 

do\dx/ 

6 m\- 

d 6 \dx) 


df d(cos 0) 
dy dd 


rçosO^m 

16 \dyl 


<■ sen0 — + r cos 0 — 
oy 36 


0 - 


Para calcular las derivadas de df/dx y df/dy respecto a 0 debe tenerse en 
cuenta que como funciones de r y 6, df/dx y df/dy son funciones compuestas 
dadas por 


~~ = D if( r cos 0» r senO) y = D 2 /(r cos 0, r sen0). 


Por consiguiente, sus derivadas respecto a 6 tienen que determinarse con la regla 
de la cadena. Apliquemos otra vez (8.27), reemplazando / por DJ, con lo que 
se obtiene 


d /df\ d(DJ) dx , d(DJ)3y dH, m dH 

fe) - ~ÎT Fe + jT n ~ïï <_r: ’> + sft (r ‘ 61 

Del mismo modo, aplicando (8.27) reemplazando / por D 2 /, encontramos 


im _ d(DJ) Bx d(DJ) dy 
dd \dy) dx 30 dy 86 


ne > + g<”° s9 >' 


Cuando estas fórmulas se aplican en (8.29) obtenemos 


9 2 ç> 

àè 2 


— r cos 0 ~ + r 2 sen 2 0 —— — r sen 0 cos 0 —— 

dx dx 2 dy dx 

„ df „ 3 2 f „ av 

— r sen 6 --r sen 0 cos 0 -1- r cos 2 6 — 

dy 3x 3y 3y 2 


Ésta es la fórmula que deseábamos para d*<p/dd 2 . Fórmulas análogas para las 
derivadas parciales segundas d*<pfdr\ d 2 <pf(dr dO), y d\f(dO dr) se proponen 
en el ejercicio 5 de la próxima sección. 
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8.22 Ejercicios 


En estos ejercicios puede suponerse la diferenciabilidad de todas las funciones que se 
consideran. 

1. La sustitución t = g(x,y) convierte F(t) en f(x,y), siendo f(x,y) = F[g(x, y)]. 

a) Demostrar que 

y £-n 

b) Considérese el caso particular F(t) = g(jc, y) = cos (x 1 + y 2 ). Calcular df/dx 

y df/dy utilizando las fórmulas del apartado a). Comprobar el resultado, determinando 
f(x, y) explícitamente en función de x e y, y calculando directamente ôf/dx y df/dy a 
partir de /. 

2. La sustitución u = (x — y)/2, v = (x + y)/2 cambia f (u, v) en F(x, y). Aplicar en forma 
adecuada la regla de la cadena para expresar las derivadas parciales dF/dx y 
3F/3y en función de las derivadas parciales df/du y 3//3v. 

3. Las ecuaciones u = f(x, y), x = X(s, t), y = Y(s,t) defmen u como función de s y t, 
u = F(s, t). 

a) Aplicar una forma adecuada de la regla de la cadena para expresar las derivadas par- 
ciales dFjds y dF/dt en función de Sf/dx, SffSy, dX/ds, SX/Bt, dY/ds, SYfdt. 

b) Si 3 2 fl(dx dy) = d 2 fl(dy dx), demostrar que 

s*f _ sf d 2 x dxey e*f df s*y s 2 //ar\ 2 

ds 2 Sx 3s 2 "^" 3x 2 \ 3s / 3s 3s 3x 3y "*" 3y 3s 2 3y 2 \ 3s ) 

c) Encontrar fórmulas parecidas para las derivadas parciales 3 2 Ff(3s 3t)y\3 2 Ff3t 2 . 

4. Resolver el ejercicio 3 en cada uno de los siguientes casos particulares: 
a) X(s,t) =s +t, Y(s, t) = st. 

b )X(s,t)=st, Y(s,t)=sft. 

c) X(s, t) = (s - /)/2, Y(s, t) = (s+ 0/2. 

5. La introducción de las coordenadas polares cambia f(x,y) en f(r, 6), donde x = r cos 9 
e y = rsen«. Expresar las derivadas parciales de segundo orden 3 2 <p/dr 2 , 3 2 <pj(3r 38) y 
d 2 <pf(38 3r) en función de las derivadas parciales de /. Pueden utilizarse las fórmulas 
deducidas en el ejemplo 2 de la sección 8.21. 

6. Las ecuaciones u = f(x, y, z), x = X(r,s,t), y = Y(r,s,t) y z = Z(r,s,t), definen u 
como función de r, s y t, sea ésta u = F(r, s, t). Aplicar la forma adecuada de la regla 
de la cadena para expresar las derivadas parciales dF/dr, 3Ff3s, ydFfdten función de las 
derivadas parciales de /, X, Y y Z. 

7. Resolver el ejercicio 6 en cada uno de los casos particulares siguientes: 

a ) X(r,s,t) = r + s + t, Y(r, s, t) = r - 2s + 3t, Z(r, s, t) = 2r + s - t. 

b ) X(r,s,t)=r 2 +s 2 +t 2 , Y(r, s, t) = r 2 — s 2 — t 2 , Z(r, s, t) = r 2 - s 2 + t 2 . 

8. Las ecuaciones u = f(x, y, z), x = X(s,t), y = Y(s,t), z = Z(s,t) define u como función 
de s y t, sea ésta u = F(s, t). Aplicando una forma adecuada de la regla de la cadena 
expresar las derivadas parciales SF/Ss y dFjdt en función de las derivadas parciales de 
f.X.Yy Z. 
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9. Resolver el ejercicio 8 en cada uno de Ios casos particulares siguientes: 

a) X(s, t) = i' 2 + t 2 , Y(s, t) = s 2 — t 2 , Z(s,t)=2st. 

b) X(s,t) =s +t, Y(s, t) = s — t, Z(s,t)=st. 

10. Las ecuaciones u = f(x,y), x - X(r,s,t), y = Y(r,s,t) defrnen u como función de r, s y 
t, sea ésta u = F(r,s,t). Aplicar una forma adecuada de la regla de la cadena y expre- 
sar las derivadas parciales dFfSr, SFf 3s y SFfSt en función de las derivadas parciales de 
f, X eY. 

11. Resolver el ejercicio 10 en cada uno de los casos particulares siguientes: 

a) X(r, s, t) = r + s, Y(r,s,t)=t. 

b) X(r, s,t) = r + í + t, Y(r, s, t) = r 2 + s 2 + t 2 . 

c) X(r, s, t) = rfs,. Y(r, s, t) = s/t. 

12. Sea h(x) =f[g(x)], donde g = (gi,... ,g n ) es un campo vectorial diferenciable en a, 
y / un campo escalar diferenciable en b = g(a). Utilizar la regla de la cadena para de- 
mostrar que el gradiente de h puede expresarse como combinación lineal de los vectores 
gradientes de los componentes de g, así: 

VA(«) = | D k f(b)Vg k (a). 

k—\ 

13. a) Si f(x, y, z) = xi + yj + zk demostrar que la matriz jacobiana Df (x, y, z) es la 
matriz identidad de orden 3. 

b) Hallar todos los campos vectoriales diferenciables /: R 3 -► R 3 para los que la ma- 
triz jacobiana Df(x,y,z) es la matriz identidad de orden 3. 

c) Hallar todos los campos vectoriales diferenciables /: R 3 ^’R 3 para los que la matriz 
jacobiana es una matriz diagonal de la forma diag (p(x), q(y), r(z)), en Ia que p, q y r 
son funciones continuas dadas. 

14. Sean /: R 2 -<■ R 2 y g: R 3 -► R 2 dos campos vectoriales definidos del siguiente modo: 

f(x,y) = e x+2v i + sen (y + 2 x)j, 
g(u, v, w) = (u + 2v 2 + 3 iv 3 ) i + (2v - u 2 )j. 

a) Calcular cada una de las matrices jacobianas Df(x,y) y Dg(u,v,w). 

b) Calcular la función compuesta h (u, v, w) =f[g(u, v, iv)]. 

c) Calcular la matriz jacobiana Dh(l, — 1,1). 

15. Sean/: R 3 -+R ! y g: R 3 -►R 3 dos campos vectoriales definidos como sigue: 

f(x, y, z) = (x 2 + y + z) i + (2x + y + z 2 )j, 
g(u, v, w) = uv 2 w 2 i + w 2 sen v j + u 2 e v k. 

a) Calcular cada una de las matrices jacobianas Df(x, y,z) y Dg(u, v, w). 

b) Calcular la función compuesta h (u, v, w) = f[g(u, v, w)]. 

c) Calcular la matriz jacobiana Dh(u,0,w). 


* 8.23 Condiciones sufìcientes para la igualdad de las derivadas parciales mixtas 

St / es una función real de dos variables, las dos derivadas parciales mixtas 
Di 2 f y D 2il f no son necesariamente iguales. Con la notación D U2 f queremos 
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significar DJDJ) = d 2 fj(dx dy) y con D 2í f signi'ficar DfDJ) = d 2 Jf(dy dx). 
Por ejemplo, si / está definida por las ecuaciones 

f(x, y) = xy — - — para (x, y) 5* (0, 0), /(0, 0) = 0, 

* + y 

es sencillo demostrar que D 2 .i/(0,0) = — 1 y D lt2 f( 0,0) = 1. Esto puede verse 
así: 

La definición de D 2 ,f( 0, 0) establece que 

(8.30) D, ,/(0, 0) = lim °./(°. <0 - P./(0.0) 

•-o k 

Ahora bien 

DJ( 0, 0) = lim — 0) ~ /( °’ 0) = o 
*- o h 

y, si (x,y) ¥= (0, 0), encontramos 

DJ(x, y) = —* + * x * yi ~ y *) 

(x 2 + y 2 ) 2 

Por consiguiente, si k ¥= 0 tenemos Dif(0,k) = = — k y por tanto 

DJ( 0, k) - DJ( Q, Q) 


Aplicando este resultado en (8.30) encontramos que D 2 .if(0, 0) = — 1. Con ra- 
zonamiento parecido demostramos que Di 2 f( 0,0) = 1, y por tanto D 2 JO, 0) ¥= 
¥= D U2 f(0, 0). 

En el ejemplo que acabamos de considerar las dos derivadas parciales mix- 
tas Di, 2 f y D..J son ambas no continuas en el origen. Puede demostrarse que 
las dos parciales mixtas son iguales en un punto (a, b) si por lo menos una de 
ellas es continua en el punto. Demostraremos primero que son iguales si ambas 
son continuas. Con mayor precisión, tenemos el teorema siguiente. 

TEOREMA 8.12. CONDICIÓN SUFICIENTE PARA LA IGUALDAD DE LAS DERIVA- 
das parciales mixtas. Si f es un campo escalar tal que las derivadas parciales 
Dif, D 2 f, D 12 f y D 2 ,\f existen en un conjunto abierto S. Si (a, b) es un 
punto de S, y en tal punto D\, 2 f y D 2 i f son continuas, entonces tenemos 

(8.31) D 12 f(a, b) = D 2 ,J(a, b). 


Demostración. Elijamos h y k no nulos tales que el rectángulo R(h,k) 
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con vértices ( a, b), (a + h, b), (a + h, b + k) y (a, b + k) esté situado en S. 
(Véase figura 8.9.) 


(a, b + k) (a + h, b + k) 

P-íl 


i± -+1 

( a, b) (a + h, b) 

Figura 8.9 V (h,k) es una combinación de los valores de f en îos vértices. 
Consideremos la expresión 

A(/i, k) = f(a + h,b + k) - f(a + h, b) - f(a, b + k) + f(a, b). 

Es ésta una combinación de los valores de f en los vértices de R(h, k), tomados 
con los signos algebraicos indicados en la figura 8.9. Expresaremos A (h, k) en 
función de D 2 ,if y también de D u2 f. 

Consideremos una nueva función G de una variable definida por la ecuación 
G(x)=f(x,b + k)-f(x,b) 

para todo x comprendido entre a y a + h. (Geométricamente, consideramos los 
valores de / en aquellos puntos en Ios que una recta vertical corta los lados hori- 
zontales de R(h, k.) Tenemos entonces 

(8.32) A (h, k) = G(a + h) - G(a ). 

Aplicando el teorema del valor medio uni-dimensional al segundo miembro de 
(8.3) obtenemos G(a + h) — G(a) = hG'(x,), siendo *i un punto situado entre 
a y a + h. Puesto que G’(x) = D,f(x, b + k) — Df(x, b), la ecuación (8.32) 
se transforma en 

(8.33) A(h, k) = h[DJ(x i, b + k)~ DJ(x u é)]. 


Aplicando el teorema del valor medio al segundo miembro de (8.33) obtenemos 

(8.34) A(h,k) = hkD 2A f( Xl , yi ), 
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siendo y^un punto situado entre b y b + k. E1 punto (*i, y x ) pertenece al rec- 
tángulo R(h, k). 

Aplicando el mismo procedimiento a la función H(y) = f(a + h, y) — f(a, y) 
encontramos una segunda expresión para A (h,k), o sea, 

(8.35) A (h, k) = hkD 12 f(x 2 , j2 ), 

donde (x 2 ,y 2 ) pertenece también a R(h,k). Igualando las dos expresiones de 
A (h, k) y suprimiendo hk obtenemos 


= D 2 i f(x t ,yá. 

Hagamos ahora que (h, k) -*■ (0,0) y teniendo en cuenta la continuidad de D ll2 f 
y D 2 J en el punto (a, b) obtenemos (8.31). 

E1 razonamiento anterior puede modificarse para demostrar una versión más 
fuerte del teorema 8.12. 

teorema 8.13. Si f es un campo escalar para el cual existen las derivadas 
parciales Dif, D 2 f y D 2 ,\f en un conjunto abierto S que contenga (a, b), y si además 
DìJ es continua en S, entonces existe la derivada DiJ(a, b) y tenemos 


Di.zfia, b) = D 21 f(a, b). 


Demostración. Definamos A (h,k) como en la demostración del teorema 
8.12. La parte de la demostración que lleva a la ecuación (8.34) es válida, dán- 
donos 


(8,36) ^hir =DiJ(xityù 

para un cierto (x,, yj del rectángulo R(h,k). E1 resto de la demostración no es 
aplicable ya que precisa de la existencia de la derivada D li2 f(a, b), que es justa- 
mente lo que deseamos demostrar. 

La defmición de D ia f(a, b) establece que 


L>i. 2 f(a, b) 


lim °J( a + h,b)- DJ(a, b) 


(8.37) 


h 
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Vamos a demostrar que este límite existe y que tiene el valor D 2l if(a, b). A par- 
tir de la definición de D 2 / tenemos 




Dl ,(„ + *.«. h /enHn-iciu) 

t-*o fe 


Por tanto el cociente de diferencias (8.37) puede escribirse del siguiente modo 

DJ(a + h,b)~ DJ(a, b ) = A (h, k) 

h *-* o hk 

Teniendo en cuenta (8.36) podemos ponerlo en la forma 

(8.3» &«■-+VAnftffi.» - „ m 

/l Jfc-0 


Para completar la demostración tenemos que probar que 

(8.39) D i,if(xi, Pi)J = D î,J(a, b). 

Cuando fc -»0, el punto yi -> b, pero es desconocido el comportamiento de x\ 
como función de fe. Si suponemos que x\ se aproxima a algún límite, sea x, 
cuando fc -> 0, entonces por la continuidad de D 2 .i/ deducimos que 


lim D it J(xi, y0 = D 2 J(x, b). 


Puesto que el límite x estaría en el intervalo a ^ x — a+h, podemos suponer que 
h 0 y deducir (8.39). No obstante, por el hecho de que x depende de fe de for- 
ma desconocida, se hace necesario un argumento algo más sólido. 

En virtud de la ecuación (8.38) sabemos que existe el siguiente límite: 


lim D 2 ,if(xi,y 1 ). 

Jfc—O 
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Designemos este límite con F(h). Para completar la demostración hay que pro- 
bar que 


limf’Oi) = £> 2>1 /(a, b). 


A tal fin apelamos a la definición de continuidad de D 2 l / en (a, b). 

Sea e un número positivo dado. La continuidad de D 2 ./ en ( a, b) significa 
que existe un disco abierto N con centro en ( a, b) y radio S, por ejemplo, tal 
que 


(8.40) \ D ì,\f(x, y) — D 2,1 f(a, 6)1 < “ siempre que ( x,y)eN . 

Si elegimos h y k de manera que \h\ < Ò/2 y \k\ < 8/2, todo el rectángulo 
dibujado en la figura 8.9 estará contenido en el entorno N y, en particular, el 
punto (*j, y0 estará en N. Por consiguiente (8.40) es válida cuando (x, y) = 
= (*i, yj y podemos escribir 

(8.41) 0 £ \D 2 J ( Xl , y,) - D 21 f(a, b )| < |. 

Mantengamos ahora fijo h y hagamos que k~*0. E1 término D 2ll f( Xl , y a ) tiende 
a F(h) y los otros términos de (8.41) son independientes de k. Tenemos por tanto 

0 £im - D 21 /(a, b)l<±< € , 

con tal que 0 < \h\ < 8/2. Pero éste es precisamente el significado de la pro- 
posición 


lim F(h) = D 21 f(a, b ) 
y, como ya dijimos, esto completa la demostración. 


Nota: Deberá o'bservarse que el teorema es también válido si en él enunciado intercam- 
biamos D,J y DiJ. 

8.24 Ejercicios varios 

1. Hallar un campo escalar / que satisfaga las dos condiciones sìguientes- 
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a) Existen y son nulas Ias derivadas parciales £>i/(0,0) y D 2 f(0, 0). 

b) Existe la derivada direccional en el origen en la dirección del vector i + j y tiene 
el valor 3. Explicar por qué tal función / no puede ser diferenciable en (0,0). 

2. Sea / una función definida como sigue: 

f(x,y) si (*.*)* (0,0), /(0,0) = 0. 

Calcular, cuando existan, las derivadas parciales siguientes: D^ffO 0) D 2 f(0 0) 

û 2 .i/(0, 0), D 12 f( 0, 0). 

3. Sea f(x, y) ■ si (x, y) # (0,0), y definamos /(0,0) = 0. 

•x 3 +y* 

a) Demostrar que la derivada f'(0; a) existe para todo vector a y calcular su valor 
en función de los componentes de a. 

b) Determinar si / es o no continua en el origen. 

4. Defmamos f(x,y) = jVzv dt para x > 0, y > 0. Calcular df/dx en función de x e y. 

5. Supongamos que las ecuaciones u = f(x,y), x = X(t), y = Y(f) definen u como función 
de t, u = F(t). Calcular la derivada tercera F’"(t) en función de las derivadas de 
/, X, e Y. 

6. E1 cambio de variables x = u + v, y = «v 2 transforma f(x, y) en g (u, v). Calcular el 
valor de S 2 g/(dv du) en el punto en el que u = 1, v = 1, sabiendo que 

V _ ^f _ Pf _ 3 2 / a 2 / 

dy dx 2 dy 2 dx dy ~ dy dx * 

en dicho punto. 

7. E1 cambio de variables x = uv, y = \ (u ! — v 1 ) transforma f(x,y) en g(u, v). 

a) Calcular igf Su, dgf dv y d 2 g/(du dv)en función de las derivadas parciales de /. (Pue- 
de suponerse la igualdad de tas parciales mixtas.) 

b) Si || V/(je, y)|| 2 = 2 para todo x e y, determinar las constantes a y b tales que 



8. Dos funciones F y G de una variable y una función z de dos variables están ligadas 
por la ecuación 

[F(x) + G(y)] 2 e zix - vì = 2 F\x)G’(ý) 

con tal que F(x) + G(y) jt 0. Demostrar que la derivada parcial mixta D 2 .iz(x, y) nunca 
es cero. (Puede suponerse la existencia y continuidad de todas las derivadas que 
aparezcan.) 

9. Un campo escalar / es acotado y continuo en un rectángulo R = [a, bj X [c, d). Se de- 
fine en R un nuevo campo escalar g del modo siguiente: 

g(u, v) = f*\J"f(x, y) dxf dy. 
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a) Puede demostrarse que para cada u fija en [«,&] la función A definida en [c, d] 
mediante Ia ecuación A(y) = J“/(*,y) dx es continua en [c, d). Utilizar este resultado 
para demostrar que 3g/3v existe y es continua en el rectángulo abierto S = ( a,b)X(c,d) 
(el interior de R). 

b) Supóngase que 


siu:»"»*] dy = si\jy (x ’ y)dy i dx 


para todo (u, v) de R. Demostrar que g es diferenciable en S y que las derivadas parcia- 
les mixtas D ia g(u, v) y D 2 .ig(u, v) existen y son iguales a f(u, v) en cada punto de S. 

10. En relación con el ejercicio 9. Supóngase que u y v se expresan paramétricamente del 
siguiente modo: u = A(t), v = B(t)\ y sea <p(t) = g[A«),fl(í)]. 

a) Determinar <p'(t) en función de f, A' y B'. 

b) Calcular <p'(t) en función de t cuando f(x, y) = e x+v y A(t) = B(t) = f. (Supóngase 
que R está situado en el primer cuadrante.) 

11. Si f(x,y,z) =(r x A) ■ (r x B), siendo r = xi + yj + zk y A y B son vectores cons- 

tantes, demostrar que Vf(x, y, z) = B x (r x A) + A x (r x B). 

12. Sear = xi + yj + zk y pongamos r = || r ||. Si A y B son vectores constantes, demos- 

trar que:| 




3 A rB r A B 

r 5 


13. Hallar el conjunto de todos Ios puntos (a,b,c), en el espacio de 3 dimensiones, en los 
cuales las dos esferas (x — af + (y - bf + (z - cf = ì y x 1 + f + z J = 1 se cortan 
ortogonalmente. (Sus planos tangentes deberán ser perpendiculares en cada punto de 
intersección.) 

14. Un cilindro cuya ecuación es y = f(x) es tangente a la superficie z 1 + 2xz + y = 0 en 
todos los puntos comunes a las dos superficies. Hallar /(*). 
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APLICACIONES DE CÁLCULO DIFERENCIAL 


9.1 Ecuaciones diferenciales en derivadas parciales 

Los teoremas de Cálculo diferencial desarrollados en el capítulo 8 tienen 
gran número de aplicaciones. Este capítulo muestra su utilización en algunos 
ejemplos relativos a las ecuaciones diferenciales en derivadas parciales, a las 
funciones implícitas y a problemas de extremos. Comenzamos con algunas obser- 
vaciones elementales referentes a las ecuaciones diferenciales en derivadas par- 
ciales. 

Una ecuación que relaciona un campo escalar / y sus derivadas parciales se 
llama ecuación diferencial en derivadas parciales. Dos ejemplos sencillos en los 
que / es una función de dos variables son la ecuación de primer orden 

(9.1) dfQc,y) = 0> 

dx 

y la de segundo orden 


(9.2) g2 /(*> y) , y) _ 0 

dx 2 dy 2 

Cada una de ellas es una ecuación diferencial en derivadas parciales lineal ho- 
mogénea. Esto es, cada una tiene ia forma L(f) = 0, siendo L un operador dife- 
rencial lineal que contiene una o más derivadas parciales. La ecuación (9.2) se 
llama ecuación de Laplace bi-dimensional. 

Parte de la teoría de las ecuaciones diferenciales lineales ordinarias puede 
extenderse a las ecuaciones diferenciales en derivadas parciales. Por ejemplo, es 
fácil comprobar que para cada una de las ecuaciones (9.1) y (9.2) el conjunto 
de soluciones es un espacio lineal. Sin embargo, hay una diferencia importante 
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entre las ecuaciones diferenciales lineales en derivadas parciales y las lineales 
ordinarias, que debe ser mencionada desde el principio. Ponemos de manifiesto 
esa diferencia comparando la ecuación en derivadas parciales (9.1) con la ecua- 
ción diferencial ordinaria 

(9-3) /'(*) = 0. 

La función más general que satisface (9.3) es f(x) = C, siendo C una cons- 
tante arbitraria. Es decir, el espacio-solución de (9.3) es uni-dimensional. Pero 
la función de tipo más general que satisface (9.1) es 

J\x,y)=g(y), 

donde g es una función cualquiera de y. Puesto que g es arbitraria podemos 
obtener con facilidad un conjunto infìnito de soluciones independientes. Por ejem- 
plo, podemos tomar g(y) = e ey y hacer que c varíe en todo el campo real. Así 
pues, el espacio solución de (9.1) es de infinitas dimensíones. 

En ciertos aspectos este ejemplo refleja lo que en general ocurre. Algunas 
veces en la resolución de una ecuación en derivadas parciales de primer orden, 
se precisa una integración para hacer desaparecer cada derivada parcial. Entonces 
se introduce un función arbitraria en la solución. Esto ocurre en un espacio de 
soluciones de infinitas dimensiones. 

En muchos problemas que incluyen ecuaciones en derivadas parciales es 
preciso seleccionar del conjunto de soluciones una solución particular que satis- 
faga una o más condiciones auxiliares. Como es lógico la naturaleza de esas 
condiciones tiene un efecto profundo en la existencia o en la unicidad de las 
soluciones. En este libro no se llegará a un estudio sistemático de tales proble- 
mas. En cambio, trataremos algunos casos particulares para ilustrar las ideas 
introducidas en el capítulo 8. 

9.2 Ecuación en derivadas parciales de primer orden con coeficientes constantes 

Consideremos la ecuación en derivadas parciales de primer orden 

(9.4) 3 ?/_(*, y) { 2 8/(x, y) _ 0 

dx dv 

Todas las soluciones de esta ecuación pueden encontrarse mediante considera- 
ciones geométricas. Expresemos el primer miembro como un producto escalar, 
y pongamos la ecuación en la forma 


(3/ + 2j) • Vf(x,y) = 0. 
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Esto nos dice que el vector gradiente Vf(x,y) es ortogonal al vector 3i + 2j en 
cada punto (x,y). Pero sabemos también que Vf(x,y) es ortogonal a las curvas 
de nivel de /. Luego esas curvas de nivel deben ser rectas paralelas a 3 i + 2j. 
Es decir, las curvas de nivel de / son las rectas 

2x - 3y = c. 

Por lo tanto f(x, y) es constante cuando 2x — 3 y es constante. Esto sugiere que 

(9.5) f(x,ý)=g(2x-3y) 
para alguna función g. 

Comprobemos ahora que, para cada función diferenciable g, el campo esca- 
lar / defìnido por (9.5) satisface realmente (9.4). Utilizando la regla de la cadena 
para calcular las derivadas parciales de / encontramos 

f~ = 2 *'( 2x -ly)> Y y = -3g'( 2x - 3y), 

3 ~dx + 2 dy ~ 6ê ( 2x ~ ~ 6g ( 2x — 3y) = 0 . 

Por consiguiente, / satisface (9.4). 

Recíprocamente, podemos demostrar que toda función / diferenciable que 
satisfaga (9.4) necesariamente debe ser de la forma (9.5) para una cierta g. 
Para ello, introduzcamos un cambio lineal de variables, 

(9.6) x = Au + Bv, y = Cu + Dv. 

Éste transforma f(x,y) en una función de u y v, sea ésta 

h(u, v) =f(Au + Bv, Cu + Dv). 

Elegiremos las constantes A,B,C,D de modo que h satisfaga la ecuación más 
sencilla 

(9.7) fo(“» u) = Q 

du 

La resolveremos y demostraremos que / tiene la forma deseada. 

Con la regla de la cadena encontramos 

Sh = 3fdx + dfdy = dl A + df c \ 

du dx du dy du dx dy 
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Puesto que / satisface (9.4) tenemos df/dy = — (3/2 )(df/dx), por lo que la ecua- 
ción toma la forma 


dh 

du 


-l M‘)- 


Por consiguiente, h satisfará (9.7) si elegimos A = \C. Tomando A = 3 y C = 2 
encontramos 


( 9 -8) x = 3 u + Bv, y = 2u + Dv. 

Con esta elección de A y C, la función h satisface (9.7), así que h(u, v) es una 
función sólo de v. 


h(u, v) = g(v) 

para una cierta función g. Para expresar v en función de x e y eliminamos u en 
(9.8) y obtenemos 2x — 3y = (26 — 3 D)v. Elijamos ahora 6 y D de manera que 
26 — 3D = 1, por ejemplo 6 = 2, D = 1. Para estos valores la transformación 
(9.6) es no singular; tenemos v = 2x — 3y, y por tanto 


f(x,y) = h(u, v) = g(v) = g(2x - 3j). 

Esto demuestra que toda función diferenciable / solución de (9.4) tiene la for- 
ma (9.5). 

E1 mismo tipo de razonamiento demuestra el siguiente teorema para las 
ecuaciones de primer orden con coeficientes constantes. 

teorema 9.1. Si g es una función diferenciable en R 1 y f es el campo 
escalar definido en R 2 por medio de la ecuación 


(9-9) f(x,y) = g(bx — ay), 

en la que a y b son constantes, no simultáneamente nulas, entonces f satisface 
la ecuación en derivadas parciales de primer orden 

(9.10) fl a/(x,y) + fc a/(x,y) = 0 

dx dy 

en todo R 2 . Recíprocamente, toda solución diferenciable de (9.10) tiene necesaria- 
mente la forma (9.9) para una cierta g. 
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9.3 Ejercicios 

En este conjunto de ejercicios puede suponerse la diferenciabilidad de todas las fun- 
ciones que se consideran. 

1. Determinar la solución de la ecuación en derivadas parciales 

^f^y) , 3 d A x >y) _ 0 

3x dy 


que satisfaga la condición f(x, 0) = sen x para todo x. 

2. Determinar la solución de la ecuación en derivadas parciales 

5 yfojfl 2 d f(x,y) Q 

dx dy 


que satisfaga las condiciones /(0,0) = 0, y D,f(x, 0) = e’ para todo x. 

3. a) Si u(x, y) = f(xy), demostrar que u satisface la ecuación en derivadas parciales 



Hallar una solución tal que u(x,x) = x*e xl para todo x. 

b) Si v(x, y) = f(x/y) para y 0, demostrar que v satisface la ecuación en derivadas 
parciales 



Hallar una solución tal que v(l, 1) = 2 y D,v(x, 1/jc) = 1/x para todo jí?ì0. 

4. Si g(u, v) satisface la ecuación en derivadas parciales 


*giu. v) 


0 , 


demostrar que g(u, v) = <p,(u) + ç> 2 (v), donde <p,(u) es una función sólo de u y <p 2 (v) 
lo es únicamente de v. 

5. Supóngase que f satisface la ecuación en derivadas parciales 


S? f 2 * 2 f 

dx* dx dy d f 


0 . 


Introducir el cambio lineal de variables x = Au + Bv, y = Cu + Dv, siendo A, B, C, D 
constantes, y póngase g(u, v) = f(Au + Bv, Cu + Dv). Calcular valores enteros no nulos 
de A, B, C, D para los que g satisfaga iïg/tfudv) = 0. Resolver esta ecuación corres- 
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pondienle a g y determinar luego /. (Supóngase la igualdad de las derivadas parciales 

6. Una función u está definida mediante una ecuación de la forma 

Demostrar que u satisface la ecuación diferencial de la forma 


n dit dtt 

C dx ^ dy 


G(x,y)tt, 


y hallar G(x, y). 

7. La sustitución x = e\ y = e‘ transforma f(x,y) en g (s,t), siendo g(s,t) = f(e s ,e*). Si se 
sabe que / satisface la ecuación en derivadas parciales 


dx 2 


. 3 2 / ¥ 8f 


demostrar que g satisface la ecuación en derivadas parciales 


*g 

ds 2 




dt 2 


8. Sea / un campo escalar diferenciable en un conjunto abierto S de R\ Decimos que / es 
homogénea de grado p en S si 


f(tx) = t'f(x) 

para todo t > 0 y todo x de S para los que tx£ S. Demostrar que para un campo es-' 
calar homogéneo de grado p se tiene 

x ■ V/(jr) = p f(x) para cada jc de S. 

Éste es el llamado teorema de Ett.er para las funciones homogéneas. Si x = (*i,..., x„) 
puede expresarse del siguiente modo 

¥ ¥ 

^ 1 + - + X n^- n = p f( Xl ,..., x n ). 

[índicación: Para x,ftjo, defínase g(t) = f(tx) y calcular g'(l).] 

9. Demostrar el recíproco del teorema de Euler. Esto es, si / satisface x .V/(x) = pf(x) 
para todo x en un conjunto abierto S, / debe ser homogéneo de grado p en S. [Indica- 
ción: Para jc.fijo, defínase g(t) = f(tx) - t»f(x) y calcular g'(í).] 
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tO Demostrar la siguiente extensión del teorema de Euler para funciones homogéneas de 
grado p en el caso de dos dimensiones. (Supóngase la igualdad de hs denvadas par- 
ciales mixtas.) 


„ s2 f s2 f &f 

* âT* + = P { P ~ X) f' 


9.4 La ecuación de ondas uni-dimensional 

Imaginemos una cuerda tensa de longitud infinita a lo largo del eje x y que 
puede vibrar en el plano xy. Designemos con y = f(x, t\ el desplazamiento ver- 
tical de la cuerda en el punto x en el instante t. Supongamos que, en el instante 
t = 0, la cuerda está desplazada tomando la forma de una curva y = F(x). En la 
figura 9.1 a) se representa un ejemplo. Las figuras 9.1 b) y c) muestran las posi- 
bles curvas de desplazamiento para valores posteriores de t. Consideremos el des- 
plazamiento f(x, t) como una función incógnita de x y t que hay que determinar. 
Un modelo matemático para este problema (sugerido por consideraciones físicas 
que aquí no comentaremos) es la ecuación en derivadas parciales 

ay 2 sy 

dt 8 dx 2 ’ 

en la que c es una constante positiva que depende de las características físicas de 
la cuerda. Esta ecuación es la llamada ecuación de ondas uni-dimensional. La re- 
solveremos teniendo en cuenta ciertas condiciones auxiliares. 



/YV 


.A 




- 2-10 1 2 


a) / = 0 


b)/ = l 


c)/= 1 


Figura 9.1 Curva de desplazamiento y = f(x, /) para varios valores de t. 


Puesto que el desplazamiento inicial es la curva dada y = F(x), vamos a 
buscar una solución que satisfaga la condición 


f(x,0) = F(x). 
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Supondremos también que dy/dt, la velocidad de desplazamiento vertical, está 
dada en el instante t — 0, a saber 

DJ(x,0 ) = G(x), 

siendo G una función dada. Parece razonable pensar que esta información debe- 
ría bastar para determinar el subsiguiente movimiento de la cuerda. Demostrare- 
mos que esto es cierto, efectivamente, determinando la función / por medio de 
F y G. La solución se expresa en una forma dada por Jean d’Alembert (1717- 
1783), matemático y filósofo francés. 

teorema 9.2. solución de d’alembert de la ecuación de ondas. Dadas 
las funciones F y G tales que G es deriváble y F dos veces derivable en R 1 . La 
función f dada por la fórmula 

(9.11) /(„,,) = Q £+c» + F(.«-c<) + J. (•"" ds 

2 2c. Jx-ct 

satisface la ecuación de ondas uni-dimensional 

(9.12) ^ =c *?ï 
dt 2 

y las condiciones iniciales 

(9.13) f(x,0) = F(x), 

Recíprocamente, cualquier función f con derivadas parciales iguales que satisfaga 
(9.12) y (9.13) tiene necesariamente la forma (9.11). 

Demostración. Comprobar que la función / dada por (9.11) satisface la 
ecuación de ondas y las condiciones iniciales,es un ejercicio que dejamos al lector. 
Demostraremos el recíproco. 

Un modo de hacerlo consiste en suponer que / es una solución de la ecuación 
de ondas, introducir un cambio lineal de variables, 

x = Au + Bv, t = Cu + Dv, 

que transforma f(x, t) en una función de u y v. 


dx 2 

D 2 f(x,0) = G(x). 


g(u, v) =f(Au + Bv,Cu+ Dv), 
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y elegir las constantes A, B. C, D de modo que g satisfaga la ecuación más sen- 
cilla 


du dv 

Resolviendo esta ecuación encontramos que g(u, v)=(pAu)-\-(pi(v), donde (pAu) es 
una función de u solamente y donde q> 2 (v) sólo lo es de v. Las constantes A, B, 
C, D pueden elegirse de manera que u—x+ct, v=x—ct, de donde obtenemos 

(9.14) f(x, t ) = 9> x (x + cf) + <p 2 (x - ct). 

Hecho esto utilizamos las condiciones iniciales (9.13) para determinar las fun- 
ciones <p x y <p 2 por medio de las funciones dadas F y G. 

Obtendremos (9.14) por medio de otro método que utiliza el teorema 9.1 
y evita el cambio de variables. Escribimos primero la ecuación de ondas en la 
forma 

(9.15) W)"0. 

siendo L x y operadores diferenciales lineales de primer orden dados por 



Sea / una solución de (9.15) y pongamos 

u(x, t) = Lif(x,t). 

La ecuación (9.15) establece que u satisface la ecuación de primer orden L!(u)=0. 
Luego, según el teorema 9.1 tenemos 

u(x, t) = <p(x + ct) 

para una cierta función <p. Sea $ una función primitiva de <p, tal como $(y) = 
<p(s)ds, y pongamos 


v(x, t) = -<D(x + ct). 
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Demostraremos que L 2 (v) = LÁf). Tenemos 


y x = ~ + cí) y 

así que 

i dv dv . 

L 2 v = — + c — = <D'(x + cí) 
ot dx 


dv 

3t 


<p(x + cí) = u(x, t ) = L 2 /. 


Es decir, la diferencia f — v satisface la ecuación de primer orden 

W-f) = 0. 

Según el teorema 9.1 debe ser f(x, t) — v(x, t) = ý(x — ct) para una cierta fun- 
ción ý. Por consiguiente 

f(x, t) = v(x, t) + xp(x - ct) = <D(x + ct) + f(x - ct). 

2 c 

Esto demuestra (9.14) poniendo ^ = — $ y <p 2 = ỳ, 

2 c 

Utilicemos ahora las condiciones iniciales (9.13) para determinar las funcio- 
nes <p y y <p 2 por medio de las funciones dadas F y C. La relación f(x, 0) = F(x) 
implica 


(9.16) <p^(x) + <p 2 (x) = F(x ). 

La otra condición inicial, D 2 f(x, 0) = G(x), implica 

(9.17) c<p[(x) - c<p' 2 (x) = G(x ). 

Derivando (9.16) obtenemos 

(9.18) <p[(x) + <p' 2 (x) = F'(x). 

Resolviendo (9.17) y (9.18) respecto a q>[(x) y <p' 2 (x) encontramos 

<PÍ(x) = \ F'(x) + ~ G(x), <p' 2 (x) = ì F'(x) - - G(x). 

z 10 22c 
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Integrando esas relaciones llegamos a 

vAx) - = / lx> 2 — + J j' u Cl ') ds> 

,,M-Wo> = ^^>J>)*. 

Sustituyamos en la primera ecuación x por x + ct y en la segunda x por x — ct. 
Luego sumemos las dos ecuaciones que resulten y teniendo en cuenta que >0) + 
<p 2 { 0 ) = F( 0 ) obtenemos 

/(x, t) = ç>i(x + cf) + ?) 2 (x - ct) = F ( x + cf ) + -£í) + A ^ G(s) c/s. 


Esto completa la demostración. 

ejemplo. Supongamos que el desplazamiento inicial viene dado por la 
fórmula 


F(x) = 


(1 + COS 7TX 

(o 


para -l<x<l, 
P ara |x| ^ 1. 



1 

>•=/(*, 2 ) 

/\ /\ 

1-2-1 0 1 2 3 

b) / = 2 


Figura 9.2 Solución de la ecuación de ondas representada para los valores t = 0 y t = 2. 


La gráfica de F se muestra en las figuras 9.1 a) y 9.2 a). Supongamos que la 
velocidad inicial G(x) = 0 para todo x. Entonces la solución que resulta de la 
ecuación de ondas viene dada por la fórmula 

/( x í) = f ( x + cf ) + f ( x ~ c< ) 
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Las figuras 9.1 y 9.2 representan la curva y = j(x, t) para varios valores de t. 
Las figuras ponen de manifiesto que la solución de la ecuación de ondas es una 
combinación de dos ondas estacionarias, una que se desplaza hacia la derecha y 
la otra a la izquierda, cada una con velocidad c. 

En los ejercicios que siguen se dan ejemplos en los que se utiliza la regla de 
la cadena en el estudio de las ecuaciones en derivadas parciales. 

9.5 Ejercicios 


Podemos suponer en estos ejercicios la diferenciabilidad de todas las funciones que 
consideran. 

L Si k es una constante positiva y g(x,t) = \xj^kt, ponemos 


f(x,t) = f l,<x ’ l> e~ u *du. 

a) Demostrar que ' J 

dx dx dt St ' 

b) Demostrar que / satisface la ecuación en derivadas parciales 


k 


sy- 

dx s 


1 

dt 


(ecuaciôn del calor). 


2. Consideremos un campo escalar / definido en R 2 tal que f(x, y) dependa sólo de la dis- 
tancia r del punto (x, y) al origen, f(x, y) = g(r), siendo r = (* 2 + Ý)' A - 
a) Demostrar que para (x, y) * (0,0) tenemos 


d2 f *f 1 , 
a/ +-âp-~s(r) +g W. 


b) Supongamos además que / satisface la ecuación de Laplace, 


dx 2 


ay 

•yi- °, 

a/ 


para todo (x,y) ^ (0,0). Demostrar, aplicando la parte a) que f(x,y)=aloe (x 2 +v 2 ) + b 
para (x, y) ^ (0,0), siendo a y b constantes. 

3. Repetir el ejercicio 2 en el caso n-dimensional, siendo n> 3. Esto es, supóngase que 
f(x) — f(x i ,... ,x n ) — g(r), siendo r = ||x||. Demostrar que 


a 2 / n — 1 

+ ' + = —f~g W +Í*W 
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para x ^ O. Si / satisface la ecuación de Laplace n-dimensional. 


ay 


a 2 / 


para todo x ^ O, deducir que/(x)= a ||jcf- B + /> para x * O, siendo a y b constantes. 
Observación: E1 operador lineal V 2 definido por la ecuación 
d 2 f S 2 f 


se llama laplaciana n-dimensional. 

4. Laplaciana bi-dimensional en coordenadas polares. La introducción de coordenadas po- 
lares x =r cos 9, y = r sen», transforma /(x,y) en g(r, 9). Comprobar las siguientes fór- 

a) || V/(r cos 0, r sen 0)f = • 


b) 


ax 2 a/ 


+ Xd l 

dr 2 + r 2 ao 2 r ar ' 


Laplaciana tridimensional en coordenadas esféricas. 
esféricas 


La introducción de coordenadas 


x = p cos 0 sen <p, y = p sen 0 sen <p , z = p COS <p , 

transforma f(x, y,z) en F(p,»,<p). Este ejercicio indica cómo hay que proceder para 
expresar la laplaciana V ! / en función de las derivadas parciales de F. 

a) Introducir primero las coordenadas polares x = r cos $, y = r sen 9 para transformar 
f(x, y, z) en g(r, 9, z). Utilizar el ejercicio 4 para demostrar que 

J dr 2 r 2 dB 2 rdr dz 2 ' 

b) Transformar luego g(r,f,z) en F(p,e,<p) tomando z = p cos <p, r = psen<p. Obsér- 
vese que, salvo un cambio de notación, esta transformación es la misma que la utilizada 
en la parte a). Deducir 

d 2 F 2 dF 1 3 2 F cos <p 3F 1 d 2 F 
^ f ~ a p 2 + p3p + p 2 d<p 2 + p 2 sen <p d<p + p 2 sen <p 30 2 

6. Este ejercicio pone de manifiesto que la ecuación de Legendre aparece cuando busca- 
mos soluciones de la ecuación de Laplace que tengan una forma especial. Sea / un 
campo escalar que satisfaga la ecuación de Laplace tri-dimensional, V 2 / = 0. Introduzca- 
mos coordenadas esféricas como en el ejercicio 5 y pongamos F(p, 9, <p) = f(x, y, z). 




358 


Aplicaciones de cálculo diferencial 


a) Supongamos que buscamos soluciones f de la ecuación de Laplace tales que F(p, e, <p) 
sean independientes de « y tengan la forma particular F(p, e, <p) = p"G(<p). Demostrar 
que / satisface la ecuación de Laplace si G satisface la ecuación de segundo orden 


d<p 2 


b) E1 cambio de variable x = cos <p (<p = arc cos x, -1 < x < 1) transforma G(<p) en 
g(x). Demostrar que g satisface la ecuación de Legendre 




+ «(» + 1)^ = 0. 


7. Ecuación bi-dimensional de ondas. Una membrana delgada y flexible está extendida 
sobre el plano xy y puede vibrar. Designemos con z = f(x,y,t) el desplazamiento vertical 
de la membrana en el punto (x, y) en el instante t. Ciertas consideraciones físicas su- 
gieren que / satisface la ecuación bi-dimensional de ondas 



en la que c es una constante positiva que depende de las características físicas de la 
membrana. Este ejercicio revela una conexión entre esta ecuación y la ecuación diferen- 
cial de Bessel. 

a) Introducir coordenadas polares x = r cos 9, y = r sen e, y pongamos F(r, e, t) = 
= f(r cos e, r sen e, t). Si / satisface la ecuación de ondas demostrar que F satisface la 
ecuación 


-- tlîl Ì* F laF \ 

3 t 2 c \ar 2+ r 2 ae 2+ 7 

b) Si F(r, e, t) es independiente de 0, F(r, 0, t ) = v ( r , t) la ecuación a) se reduce a 

32 <P _ J 32 <p 1 3ç>\ 

3t 2 ~ C yìr* + ~r~dr) ' 

Sea ahora <p una solución tal que <p(r, t) se escinde en el producto de una función de r 
por una función de t, <p(r,t) = R(r)T(t). Demostrar que cada una de las funciones R y T 
satisface una ecuación diferencial lineal de segundo orden. 

c) Si la función T del apartado b) es periódica de período 2 7r/c, demostrar que R sa- 
tisface la ecuación de Bessel r 2 R" + rR' + r 2 R = 0. 
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9.6 Derivación de funciones definidas imph'citamente 

Algunas superficies en el espacio de tres dimensiones se representan por ecua- 
ciones cartesianas de la forma 


F(x,y,z ) = 0. 

Una ecuación como ésta, decimos, proporciona una representación implícita de la 
superficie. Por ejemplo, la ecuación x* + y 2 + z 2 — 1 = 0 representa la superfi- 
cie de una esfera unidad con centro en el origen. Algunas veces es posible des- 
pejar en la ecuación F(x, y, z) = 0 una de las variables en función de las otras 
dos, por ejemplo z en función de x e y. Esto nos conduce a una o varias ecuacio- 
nes de la forma 


z=f(x,ý). 

Para la esfera tenemos dos soluciones, 

z = Vl — x 2 — y 2 y z = — V1 — x 2 — y 2 , 

una representa la semiesfera superior, la otra la semiesfera inferior. . 

En general no resulta sencillo obtener una fórmula explícita para z en fun- 
ción de x e y. Por ejemplo, no hay un método para despejar con facilidad z en 
la ecuación y 2 + xz + z 2 — e’ — 4 = 0. Sin embargo, utilizando en forma ade- 
cuada la regla de la cadena se pueden deducir varias propiedades de las derivadas 
parciales 9 f/dx y 9//9y sin un conocimiento explícito de f(x, y). En esta sección 
se expone dicho método. 

Supongamos que existe una función f(x, y) tal que 
(9.19) F[x,y,f(x,y)] = 0 

para todo (x, y) en un cierto conjunto abierto S, y que no sea posible dispo- 
ner de fórmulas explícitas para calcular f(x, y). Expresemos ésta diciendo que 
F(x, y, z) = 0 define z implícitamente como función de x e y, y escribamos 


z=f(x,y). 

Introduzcamos ahora una función auxiliar g definida en S como sigue: 
g(x,y) = F[x,y,f(x,y)]. 
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La ecuación (9.19) establece que g(x, y) = 0 en S; luego las derivadas parciales 
dg/dx y dg/dy son también 0 en S. Pero también podemos calcular esas deriva- 
das parciales mediante la regla de la cadena. Para ello escribamos 

g(x,ỳ) = F[ Ul (x,ỳ), Uì (x,ý), u 3 (x,ý)\, 

siendo u^x, y) = x, u 2 (x, y) = y, y u 3 (x, y) = f(x, y). La regla de la cadena nos 
da las fórmulas 


d / = + Wj 1 + D fj 1 • ÏT = D iF ^ + D 2 F d -^+ d 3 f — , 

ox ox tìx tìx tìy tìy tìy dy 


en las que cada derivada parcial DkF está calculada en (x, y, f(x, y)). Puesto que 
tenemos 


_ i àfh _ q du 3 df 
dx tìx ’ tìx tìx’ ^ 

la primera de las ecuaciones anteriores se transforma en 

DjF + D 3 F — = 0. 
tìx 

Resolviéndola respecto a df/'àx obtenemos 


(9.20) 


y D iF[x, y ,f(x, y)] 

dx D 3 F(x,y,f(x,y)] 


dg 

tìx " 


en los puntos en los que D 3 F[x, y, f(x, y)] ¥= 0. Mediante un razonamiento pare- 
cido obtenemos una fórmula análoga para df/tìy: 


df D 2 F(x, y,f(x, y)] 

dy D 3 F[x, y,f(x, y)] 


en los puntos en los que D 3 F[x, y, f(x, y)] =£ 0. Ordinariamente esas fórmulas 
se escriben más brevemente así: 


df_ _ tìF/tìx tìf = tìF/tìy 

dx dF/tìz ’ tìy tìFftìz ' 
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ejemplo. Supongamos que la ecuación y 2 + xz + z* — e* — c = 0 defi- 
ne z como función de x e y, sea ésta z = f(x, y). Hallar un valor de la constante 
c para el cual f(0, e) = 2, y calcular las derivadas parciales df/dx y df/dy en el 
punto (x, y) = (0, e). 

Solución. Cuando x = 0,y = eyz = 2\a ecuación toma la forma e 2 + 4 
— e 2 — c = 0, y ésta se satisface para c = 4. Sea F(x, y, z) = y 2 + xz + z 2 — 
e z — 4. De (9.20) y (9.21) obtenemos 

df_ _ z df _ 2 y 

dx x + 2 z — e z ’ dy x + 2 z — e z 

Cuando * = 0 , ji = «, y z = 2 encontramos df/dx = 2/(e 2 — 4) y df/dy = 
2e/(e 2 — 4). Obsérvese que hemos podido calcular las derivadas parciales df/dx 
y df/dy utilizando tan sólo el valor de f(x, y) en el punto (0, e). 

La discusión anterior puede extenderse a funciones de más de dos variables. 

teorema 9.3. Si F es un campo escalar diferenciable en un conjunto abier- 
to T de R" y si suponemos que la ecuación 

F(x i,...,x„) = 0 

define implícitamente x„ como función diferenciable de x x ,..., x n -i 
x„-f(x 

para todos los puntos (xi,... ,x n -f) en un cierto conjunto S de R" -1 , entonces 
para cada k = 1,2— 1, la derivada parcial D k f viene dada por la fórmula 

en los puntos en los que D„F + 0. Las derivadas parciales DkF y D„F que apa- 
recen en (9.22) están calculadas en el punto (x u x 2 ,..., x n -i, f(x, ,..., Xn-t)). 

La demostración es una extensión directa del razonamiento utilizado para 
deducir las ecuaciones (9.20) y (9.21) y la dejamos para el lector. 

La discusión puede generalizarse en otro sentido. Supongamos dos superfi- 
cies con las representaciones implícitas siguientes: 

(9.23) F(x, y,z) = 0, G(x, y, z) = 0. 


Si esas superficies se cortan a lo íargo de una curva C, es posible obtener una 
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representación paramétrica de C resolviendo las dos ecuaciones (9.23) simultá- 
neamente respecto a dos de las variables en función de la tercera, por ejemplo 
reyen función de z. Supongamos que sea posible despejar x e y y que las solu- 
ciones vengan dadas por las ecuaciones 

x = X{z), y = Y(z) 

para todo z en un cierto intervalo abierto (a, b) Entonces cuando x e y se reem- 
plazan por X(z) e Y(z), respectivamente, las dos ecuaciones (9.23) se satisfacen 
idénticamente. Esto es, podemos escribir F[X(z), Y(z), z] = 0 y G[X(z), Y(z), z] 
= 0 para todo z de (a, b). Volviendo a usar la regla de la cadena, podemos cal- 
cular las derivadas X'(z) e Y\z) sin un conocimiento explícito de X(z) e Y(z). 
Introduzcamos para ello dos nuevas funciones / y g por medio de las ecuaciones 

m = F(X(z), Y(z), z] y g(z) - G (X(z), Y(z), zj. 

Entonces f(z) = g(z) = 0 para todo z de (a, b) y por tanto las derivadas f'(z) 
y g'(z) también son cero en (a, b). Con la regla de la cadena esas derivadas se 
expresan con las fórmulas 


/'(z) 


fn, ) + f n , ) + f. 

ox oy oz 


rtz )-fx-(z ) + fnz ) + f. 

ox oy oz 


Puesto que f'(z) y g’(z) son ambas cero podemos determinar X'(z) e Y'(z) resol- 
viendo el siguiente sistema de ecuaciones lineales: 


|x (2) + |r ( z) 


dF 
dz ’ 




dG 

dz 


En aquellos puntos en los que el determinante del sistema no es nulo, el sistema 
tiene una sola solución que, mediante la regla de Cramer, se puede expresar así: 


dF 

dF 


dF 

dF 

dz 

dy 


dx 

dz 

dG 

dG 


dG 

dG 

dz 

_dy_ 

, y' (2) = - 

dx 

dz 

dF 

dF 

dF 

dF 

dx 

dy 


dx 

dy 

dG 

dG 


dG 

dG 

dx 

dy 


dx 

dy 
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Los determinantes que aparecen en (9.24) son determinantes de matrices de 
Jacobi y se llaman determinantes jacobianos. Con frecuencia se emplea una nota- 
ción especial para los determinantes jacobianos. Escribimos 


dfi 

d A 

dA 

dx. 

dx 2 

dx n 

dfn 

3/n 

.. d fn 

_3x, 

dx 2 

dx n _ 


Con esta notación, las fórmulas (9.24) pueden expresarse más brevemente en la 
forma 


(9.25) 


= d(F, G)ld(y, z) = d(F, G)/d(z, x) 

d(F,G)ld(x,y)’ d(F, G)/d(x, y) 


(E1 signo menos se ha incorporado a los numeradores permutando las columnas.) 

E1 método se puede extender a casos más generales en los que se dan m ecua- 
ciones con n variables, siendo n > m obteniéndose m variables en función de 
las n - m restantes. Las derivadas parciales de las nuevas funciones así defini- 
das se pueden expresar como cocientes de determinantes de Jacobi, generalizando 
así (9.25). En el ejercicio 3 de la sección 9.8 se da un ejemplo en el que m = 2 
y n = 4. ... 


9.7 Ejemplos resueltos 

En esta sección ilustramos algunos de los conceptos de la anterior resolviendo 
algunos problemas relativos a funciones definidas implícitamente. 

ejemplo 1 . Supongamos que la ecuación g(x, y) = 0 determina y como 
funcion derivable de x, sea ésta y = Y(x) para todo x en un cierto intervalo (a, b). 
Expresar la derivada Y'(x) en función de las derivadas parciales de g. 

Soíución. Sea G(x) = g[x, Y(x)] para x en (a, b). Entonces la ecuación 
g(x, y) = 0 implica G(x) = 0 en (a, b). En virtud de la regla de la cadena 
tenemos 


c-W = ^i + fírw, 

dx dy v ' 
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de la que obtenemos 
(9.26) 


Y'(x) = - 


dg/dx 

dg/dy 


en los puntos x de (a, b) en Ios que dg/dy ¥= 0. Las derivadas parciales dg/dx 
y 3g/9y vienen dadas por las fórmulas 3g/3jc = Dxg[x, y(x)] y dg/dy = D 2 g 
[x, Y(x)]. 

ejemplo 2. Cuando se elimina y entre las dos ecuaciones z = f(x, y) y 
g(x, y) = 0, el resultado puede expresarse en la forma z = h(x). Expresar la deri- 
vada h'(x) en función de las derivadas parciales de / y g. 

Solución. Supongamos que la ecuación g(x, y) = 0 puede resolverse res- 
pecto a y en función de x y que una solución sea y = Y(x) para todos los valores 
de x de un cierto intervalo abierto (a, b). Entonces la función h será 


h(x) = f[x, 7(x)] si x e (a, b). 

Aplicando la regla de la cadena tenemos 

h'(x) = + Y Y'(x). 

ox oy 


Con la ecuación (9.26) del ejemplo 1 obtenemos la fórmula 


h'(x) = 


dgd±_dj_d_g 
dy dx dy dx 
dg 
dy 


Las derivadas parciales del segundo miembro están calculadas en el punto (x, Y(x)). 
Obsérvese que el numerador también puede expresarse como un determinante 
jacobiano, resultando 


h'(x) = 


d(f, g)ld(x, y) 
dg/dy 


ejemplo 3. Las dos ecuaciones 2x = v 3 — u 2 e y = uv definen u y v como 
funciones de x e y. Hallar las fórmulas correspondientes aduldx,duldy,dv/dx,dvldy. 


Solución. Si mantenemos fija y y derivamos las dos ecuaciones citadas con 
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respecto a x, recordando que «yu son funciones de x e y, obtenemos 


2 


du 

dx 


y 


0-»|5h 

dx 


du 

dx' 


Resolviendo estas ecuaciones respecto a du/dx y 3v/3x encontramos 
3u _ _ u y 3a _ v 

dx u 2 + v 2 dx m 2 + t) 2 

Por otra parte, si mantenemos fija x y derivamos las dos ecuaciones dadas res- 
pecto a y obtenemos las ecuaciones 


_ _ dv _ 3 u 

0 = 2v- - 2u— y 

oy oy 

De este sistema de dos ecuaciones obtenemos 


3p 3m 
dy V dy 


du _ v 
dy m 2 + v 2 


dv _ 
dy 


m 2 + a 8 

ejemplo 4. Sea u una función de x e y definida por la ecuación 


u = F(x + u,yu). 

Hallar du/dx y du/dy en función de las derivadas parciales de F. 

Solución. Supongamos que u = g(Ac, y) para todo (x, y) en un cierto con- 
junto abierto S. Sustituyendo g(x,y) por u en la ecuación original obtenemos 


(9.27) 


g(x,y) = Fiu^x^y), u 2 (x,y)]. 


en donde u,(x, y) = x + g(x, y) y u 2 (x, y) = y g(x, y). Mantengamos ahora y 
fija y derivemos ambos miembros de (9.27) respecto a x, empleando la regla de 
la cadena en el segundo miembro, con lo que obtenemos 




Pero dujdx = 1 + dgjdx, y 

— = D X F • i 
dx l 


du 2 /dx = y dg/dx. Luego (9.28) se convierte en 
3g\ 
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Resolviendo esta ecuación respecto a dg/dx (y poniendo du/dx en lugar de dg/dx) 
obtenemos 


du _ -D t F 

dx D^F + y D 2 F — 1 
Del mismo modo encontramos 


d -I=D lF d Jh. 

dy dy 


D 2 F ^ = D\F ^ + D 2 FÌy ^ H 


g(x, y) 


Esto nos conduce a la ecuación 

du _ -g(x, y) D 2 F 

dy D^F + y D 2 F — 1 


Las derivadas parciales D,F y D 2 F están calculadas en el punto (x + g(x, y), 

yg(x, y)). 

ejemplo 5. Cuando u se elimina entre las dos ecuaciones x = u + v e 
y = uv 2 llegamos a una ecuación de la forma F(x, y, v) = 0 que define implíci- 
tamente v como función de x e y, sea v = h(x, y). Demostrar que 


dh _ h(x, y) 

dx ~ 3h(x, y) - 2x 

y encontrar una fórmula análoga para dh/dy. 

Solución. Eliminando u entre las dos ecuaciones dadas, obtenemos la re- 
lación 


xv 2 — v 3 — y = 0. 

Sea F la función definida por la ecuación 


F(x,y, v) = xv 2 — v 3 — y. 


Podemos aplicar ahora lo dicho en la sección 9.6 y escribir 
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Pero dFjdx = v 2 , dF/dv = 2xv — 3v 2 y dF/dy = — 1. Luego las fórmulas (9.29) 
se convierten en 

dh _ v 2 _ v _ h(x, y ) 

dx ~ 2xv - 3v 2 ~ 2x — 3v ~ 3h(x, y) - 2x 

dh = _ -1 _ 1 _ 

dy ~ 2xv - 3v 2 2xh(x, y) - 3h 2 (x, y)' 

EJEMPLO 6. La ecuación F(x, y, z) = 0 define implícitamente z como fun- 
ción de x e y, sea z = f(x, y). Suponiendo que d 2 F/(dx dz) = d 2 Fj(dz dx), de- 
mostrar que tenemos 



donde las derivadas parciales del segundo miembro están calculadas en 
(x, y, f(x, y)). 

Solución. Según la fórmula (9.20) de la sección 9.6 tenemos, 

(9.31) 9/ _ dF/dx 

dx dF/dz 

Hay que recordar que este cociente significa en realidad 

DiF[x, y,f(x, y)] 

D 3 F[x, y,f(x, y)]' 


Introduzcamos G(x, y) = DJlx, y, f(x,y)] y H(x, y) = D 3 F[x, y, f(x, y)]. Nos 
proponemos calcular la derivada parcial respecto a x del cociente 


dj_ = _ G(x, y) 
dx H(x, y) ’ 


manteniendo la y fija. Aplicando la regla de la derivación de un cociente resulta. 
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Puesto que G y H son funciones compuestas, usamos la regla de la cadena para 
calcular las derivadas parciales dG/dx y dH/dx. Para dG/dx tenemos, 

~ = D^D.F) ■ 1 + D 2 (D,F) ■ 0 + D 3 (DjF) ■ % 
ox dx 

= ^l + 3 2 F df 
dx 2 dz dx dx 

Análogamente, encontramos 

— = D x (D 3 F) • 1 + D 2 (D 3 F) • 0 + D 3 (D 3 F) • d -f 
dx ox 

_ d 1 2 3 4 F d 2 F df 

dx dz dz 2 dx 

Sustituyendo en (9.32) y reemplazando df/dx por el cociente (9.31) obtenemos 
la fórmula (9.30). 

9.8 Ejercicios 

En los ejercicios de esta sección se supone la existencia y la continuidad de todas las 
derivadas que intervienen. 

1. Las dos ecuaciones x + y = uv y xy = u — v definen x e y como funciones implícitas 
de u y v, sean éstas x = X(u, v) e y = Y(u, v). Demostrar que 3X/ du.=(xv — ì)/(x — y) 
si x + y, y hallar fórmulas parecidas para dX/dv, dYjdu, dY/dv. 

2. Las dos ecuaciones x + y = uvyxy = u — v definen x y v como funciones de u e y, 
sean éstas x = X(u, y) y v = V(u, y). Demostrar que dX/du = (u + v.)/(l+ yu) si 
1 + yu î* 0, y hallar las fórmulas de dXjdy, dV/du, dV/dy. 

3. Las dos ecuaciones F(x,y,u,v)=0y,G(xjỳ,u,v) = 0 determinan x e y como funciones 
implícitas de u y v, sean éstas x = X(u, v) e y = Y(u, v). Demostrar que 

dX d(F, G)ji(y, u) 

1 « ~ d(F, G)l d(x, y) 

en los puntos en los que el jacobiano d(F, G)/d(x, y)/0, y hallar las fórmulas para 
las derivadas parciales 9X/3v, dY/du y dY/dv. 

4. La intersección de las dos superfìcies dadas por las ecuaciones cartesianas 2+ + 3y 2 —z ! = 
=25 y x 2 +y 2 = z ! contiene una curva C que pasa por el punto P = (/7/3,4). Esas 
ecuaciones pueden resolverse respecto a x e y en función de z con lo que se obtiene la 
representación paramétrica de C con z como parámetro. 

a) Hallar un vector unitario T tangente a C en el punto P sin utilizar el conocimiento 
explícito de la representación paramétrica. 

b) Confrontar el resultado del apartado anterior a) mediante la representación para- 
métrica de C con z como parámetro. 
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5. Las tres ecuaciones F(u, v) = 0, u = xy y v = Vx J + z 2 definen una superficie en el espa- 
cio xyz. Hallar un vector normal a esa superficie en el punto x = 1 , y = 1 , z = VT si 
se sabe que D,F(\, 2) = 1 y D 2 F( 1,2) = 2. 

6. Las tres ecuaciones 


x 2 — 7 cos (uv) + z 2 = 0, 

+ y* _ sen (uv) + 2z 2 = 2, 
xy — sen u cos v + z = 0, 

definen x,y ,z como funciones de u y v. Calcular las derivadas parciales dx/du yd x /3v 
en el punto x = y = l, u = tt]2, v = 0, z = 0. 

7. La ecuación /( y/x, z/x) = 0 define z implícitamente como función de r e y, sea esa 
función z = g(x, y). Demostrar que 


dx y dy 


=g(*,y) 


en los puntos en los que Dif[y/x, g(x, y)/x) es distinta de cero. 

8. Sea F una función real de dos variables reales y supongamos que las derivadas parciales 
DiF y DiF son siempre distintas de cero. Sea u otra función real de dos variables reales 
tales que las derivadas parciales Bu/dxy Bu/dy están ligadas por la ecuación F(3u/dx, 
B u j dy) = 0. Demostrar que existe una constante n tal que 


3 2 u 3 2 u / 3 2 u \ n 

3x 2 3y 2 \ 3x 3y/ ’ 

y encontrar n. Suponer que 3 2 u/(3x 3y) = 3 2 uj(3y 3x). 

9. La ecuación x + z + (y + z) 2 = 6 define z como función implícita de x e y, sea 
z = f(x, y). Calcular las derivadas parciales 3fj3x, 3fj3y, y 3 2 fj ( 3x 3y) en función de 
x,y, y z. 

10. La ecuación sen (x + y) + sen (y + z) = 1 define z como función implícita de x e y, 
sea z = f(x,y). Calcular la derivada segunda Di.if en función de x,y,.y z. 

11. La ecuación F(x + y + z.x 2 + f + sY) = 0 define z como función implícita de x e y, 
sea z = f(x, y). Determinar las derivadas parciales 3fjdx y 3fjdy en función de las par- 
ciales DiF y DJF. 

12. Sean / y g dos funciones de una variable real y definamos F(x,y) = f[x + g(y)]. Hallar 
las fórmulas correspondientes a todas las derivadas parciales de F de primero y segundo 
orden, expresadas en función de las derivadas de / y g. Comprobar la relación 


3F 3 2 F _ 3F 3 2 F 
3x 3x 3y 3y 3x 2 ’ 


9.9 Máximos, mínimos y puntos de ensilladura 


Una superficie definida explícitamente por una ecuación de la forma 
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z = f(x, y) puede considerarse como una superficie de nivel del campo escalar F 
definido por la ecuación 


F(x,y,z) =f(x,y ) - z. 

Si / es diferenciable, el gradiente de ese campo viene dado por el vector 

■'-ï-ï'-- 

La ecuación lineal que representa el plano tangente en un punto P L = (x L , y u z L ) 
puede escribirse en la forma 


en la que 


z - Zj = A(x- x L ) + Bfy-yJ, 

A = B L f(x L ,y t ) y B = D 2 f ( Xl , . 


Cuando los dos coeficientes A y B son nulos, el punto P L se llama punto esta - 
cionario de la superficie y el punto (x u y L ) se llama punto estacionario o crítico 
de la función /. E1 plano tangente en un punto estacionario es horizontal. Gene- 
ralmente los puntos estacionarios de una superficie se clasifican en tres catego- 
rías: máximos, mínimos y puntos de ensilladura. Si la superficie se imagina como 
un terreno montanoso, esas categorías corresponden, respectivamente, a las cum- 
bres, a los fondos de los valles y a los puertos. 

Los conceptos de máximos, mínimos y puntos de ensilladura, se pueden in- 
troducir para campos escalares cualesquiera definidos en subconjuntos de R". 


definición. Se dice que un campo escalar f tiene un máximo absoluto en 
un punto a de un conjunto S de R" si 


(9.33) 


m <,f(a) 


para todo x de S. El número f(a) se llama máximo absoluto de f en S. Se dice 
que la función f tiene un máximo relativo en a si la desigualdad (9.33) se satisfa- 
ce para todo x de una cierta n-bola B(a) contenida en S. 

Dicho de otro modo, un máximo relativo en a es el máximo absoluto en un 
cierto entorno de a. E1 mínimo absoluto y el mínimo relativo se definen de modo 
parecido, empleando la desigualdad opuesta a la (9.33). Algunas veces se emplean 
los adjetivos global y local en Iugar de absoluto y relativo respectivamente. 

definición. Un número que sea máximo relativo o mínimo relativo de 
f se llama extremo de f. 
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Si / tiene un extremo en un punto interior a y es diferenciable en él, todas 
las derivadas parciales de primer orden D t f(a),..., D„f(a) deben ser cero. Es 
decir, V f(a) = O (Esto se puede probar fácilmente manteniendo fijo cada com- 
ponente y reduciendo el problema al caso uni-dimensional). En el caso n = 2, 
esto significa que hay un plano horizontal tangente a la superficie z = f(x, y) en el 



a) z = 2 — x 2 — y 1 b) Curvas de ttivel : x* + y 2 = c 


Ejemplo 1. Máximo relativo en el origen. 



c ) Z = X - + f 


Ejemplo 2. Mínimo relativo en el origen. 


Figura 9.3 Ejemplos 1 y 2. 






372 Aplicaciones de cálculo diferencial 

punto («,/(«)). Por otra parte, es sencillo encontrar ejemplos en los que la anu- 
lación de todas las derivadas parciales en a no implica necesariamente un extremo 
en a. Esto sucede en los llamados puntos de ensilladura que se defìnen del modo 
siguiente. 

definición. Supongamos que f sea diferenciable en a. Si V /(«) = O el 
punto a se llama punto estacionario de f. Un punto estacionario se llama de ensi- 
lladura si toda n-bola B(a) contiene puntos x tales que f(x) </(«) y otros para 
los que f(x) >/(«).. 

La defìnición es análoga a la del caso uni-dimensional en el que los puntos 
estacionarios de una función se clasifìcan en máximos, mínimos y puntos de in- 
flexión. En los ejemplos que-siguen se consideran varios tipos de puntos estacio- 
narios. En cada caso el punto estacionario que se considera es el origen. 

ejemplo 1. Máximo relativo. z = f(x,y) = 2 — x 2 — y 2 . Esta superfìcie 
es un paraboloide de revolución. En las proximidades del origen tiene la forma 
indicada en la figura 9.3 a). Sus curvas de nivel son círculos, alguno de los cuales 
está dibujado en la figura 9.3 b). Puesto que f'(x, y) = 2 — (x 2 + y 2 X 2 = 
= /(0,0) para todo (x, y), resulta que / no tan sólo tiene en (0,0) un máximo 
relativo, sino también un máximo absoluto en todo conjunto que contenga el ori- 
gen. Las dos derivadas parciales df/dx y 3 f/dy se anulan en el origen. 

ejemplo 2. Mínimo relativo. z = f(x, y) = x* + y 2 . Este ejemplo, otro 
paraboloide de revolución, es en esencia el mismo que el ejemplo anterior, salvo 
que en el origen hay un mínimo en lugar de un máximo. E1 aspecto de la super- 
fìcie en las cercamas del origen se aprecia en la fìgura 9.3 c) y algunas curvas 
de nivel están dibujadas en la fìgura 9.3 b). 

ejemplo 3. Punto de ensilladura. z = f (x, y) = xy. Esta superfìcie es un 
paraboloide hiperbólico. Cerca del origen es parecida a una silla de montar, como 
se ve en la fìgura 9.4 (a). Las dos derivadas parciales df/dx y 3//3y son nulas 
en el origen pero no existe en él ni máximo ni mínimo. En efecto, para puntos 
(■ x,y ) del primero o tercer cuadrantes, x e y tienen el mismo signo, dándonos 
f( x > y) > 0 = /(0, 0), mientras que para puntos del segundo y cuarto cuadrantes 
x e y tienen signos opuestos, y es f(x, y) < 0 = /(0,0). Por consiguieríte, en todo 
entorno del origen hay puntos en los que la función es menor que/(0, 0) y puntos 
en los que es mayor que /(0,0), de modo que el origen es un punto de ensilia- 
dura. En la fìgura 9.4 b), se representa también el punto de ensilladura y las 
curvas de nivel erí las proximidades de (0,0). Esas son hipérbolas que tienen los 
ejes x e y como asíntotas. 
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Figura 9.4 Ejemplo 3. Punto de ensilladura en el origen. 


ejemplo 4. Punto de ensilladura. z = f(x,y) = x 3 — 3xy 2 . Cerca del ori- 
gen, esta superficie tiene el aspecto de un puerto de montana entre tres picos. 
Está representada en la figura 9.5 a). Algunas curvas de nivel se ven en la figu- 
ra 9.5 b). E1 punto de ensilladura está en el origen. 




Figura 9.5 Ejemplo 4. Punto de ensilladura en el origen. 
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ejemplo 5. Mínimo relativo. z = f(x,y) = x 2 y 2 . Esta superfìcie se parece 
a un valle circundado por cuatro montanas, como sugiere la figura 9.6 a). Existe 
un mínimo absoluto en el origen, ya que f(x, y) > (/(0, 0) para todo (x,y). Las 
curvas de nivel [representadas én la figura 9.6 b)] son hipérbolas cuyas asíntotas 
son los ejes x e y. Obsérvese que esas curvas de nivel son parecidas a las del 
ejercicio 3. En este caso, no obstante, la función toma únicamente valores no ne- 
gativos a lo largo de todas sus curvas de nivel. 




b' Curvas de nivel: 1 — x 2 = c 


Figura 9.7 Ejemplo 6. Máxitno relativo en el origen. 
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ejemplo 6. Máximo relativo. z = (J(x, y) = 1 — x 2 . En este caso la su- 
perficie es un cilindro con generatrices paralelas al eje y, como muestra la figura 
9.7 a). Las secciones por planos paralelos al eje x son parábolas. Es evidente que 
existe un máximo absoluto en el origen debido a que f(x, y)=l— x 2 <l =/(0,0) 
para todo (x, y). Las curvas de nivel forman una familia de rectas paralelas como 
se ve en la figura 9.7 b). 

9.10 Fórmula de Taylor de segundo orden para campos escalares 

Si un campo escalar diferenciable / tiene un punto estacionario en a, la 
naturaleza de éste queda determinada por el signo algebraico de la diferencia 
/( x) — /(«) para x próximo a «. Si jc = a + y, tenemos la fórmula de Taylor de 
primer orden 

f(a + y) — f(a) = V/(a) • y + ||.y|| E(a, ý) , donde E(a, ý) -► 0 cuando y -► O 
En un punto estacionario, V/(a) = O y la fórmula de Taylor toma la forma 
/(« + y) -f(a) = llj’l E(a,ý). 

Para determinar el signo algebraico de f(a + ý) — f(a) necesitamos más infor- 
mación relativa al término de corrección Ibll E(a,ý). E1 teorema que sigue nos 
dice que si / tiene en a, derivadas parciales de segundo orden continuas, el tér- 
mino de corrección o complementario es igual a la forma cuadrática, 

jÎÎv(«)Mi 

más un término de orden menor que ||j’|| 2 . Los coeficientes de la forma cuadrá- 
tica son las derivadas parciales de segundo orden £)„•/ = DfDjf), calculadas en a. 
La matriz nXn de las derivadas segundas Dijf(x) es la llamada matriz hessiana (*) 
y se designa por H(x). Así pues, tenemos 


H(x) = [£>„/(*)], 


con tal que existan las derivadas. La forma cuadrática puede escribirse más sen- 
cillamente en forma matricial como sigue: 

2 2 D <í/(«)y<Ti = yH(a)ý, 
i=i í-i 


(*) De Ludwig Otto Hesse (1811-1874), matemático alemán autor de muchas contri 
buciones a la teoría de superficies. 
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en donde y = (y u ... ,y„) se considera como una matriz fila 1 Xn, e ý es su 
transpuesta, una matriz columna nXl. Cuando las derivadas parciales Di,f son 
continuas tenemos Daf = Djif y la matriz f/(a) es simétrica. 

La fórmula de Taylor que da una aproximación cuadrática para f(a + j) - 
f(a), toma ahora la siguiente forma. 

TEOREMA 9.4. FÓRMULA DE TAYLOR DE SEGUNDO ORDEN PARA CAMPOS ES- 

calares. Si f es un campo escalarcon derivadas parciales segundas D, ; / conti- 
nuas en una n-bola B(a), entonces para todo y de R n tal que a + ys B(a) 
tenemos 

(9.34) f(a + y) —f(a) = V/(e) • y + yH(a + cý)y*, donde 0 < c < 1. 
Esto puede escribirse también en la forma 

(9.35) f(a +y)~ /(«) = V/(a) • y + ^yH(a)ý + M* Efa, y) , 


en donde E 2 (a,y)-*- 0 cuando y-*0. 

Demostración. Mantengamos y fijo y definamos g(u) para u real mediante la 
ecuación 

g(u) =/(« + uý) pâra -1< u < 1. 

Entonces f(a + y) — f(a) = g(l) — g(0). Demostraremos el teorema aplicando la 
fórmula de Taylor de segundo orden a e en el intervalo [0,1]. Obtenemos 


(9.36) g(i) — g (0) = g'(0) + g"(c), donde 0 < c < 1. 

Aquí hemos utilizado para el resto la forma de Lagrange (véase la sección 7.7 del 
Volumen I). 

Puesto que g es una función compuesta dada por g(u) = f[r(u )], siendo 
r(u) = a + uy podemos calcular su derivada mediante la regla de la cadena. 
Tenemos r'(u) =.y así que la regla de la cadena nos da 


g'( u ) = V/[r(u)] • r'(u) = V/[r(u)] y -'S,D i f[Ku)ìy i , 
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con tal que r(u) e B(a) . En particular, g'(0) = Vf(a) ■ j.Aplicando una vez más 
la regla de la cadena encontramos 

g "(u) = f D i{lDif[r(u)]y^y t = Ì ÌAi/tKw)]^i =yH[r(u)y. 

Luego g"(c) = yH(a + cy)y\ con lo que la ecuación (9.36) se transforma en la 
(9.34). 

Para demostrar (9.35) definamos E 2 (a, y) por la ecuacion 

(9.37) M* E 2 (a, ^) = y{H(a + cy) - H(a)}y* si y^O, 

y sea E 2 (a, O) = 0. Entonces la ecuación (9.34) toma la forma 

f(a +y) - /(«) = V/(«) • y + jj yH(a)y‘ + \\yf E 2 (a, y). 

Para completar la demostración necesitamos probar que E 2 (a,y)-+ 0 cuándo 

De (9.37), obtenemos 


M* I E t (a, y)| = ^||2 í D o/( a + «JO - D ii/(«)}Mi | 
<^22 i D o/( a +^) - Ai/(«)i iij’f. 


Dividiendo por ||y|| 2 obtenemos la desigualdad 


l £ 2(«,3’)l \ 221 D tì f(a + cy) - D fj f(a)\ 


para ji/O. Puesto que cada derivada parcial segunda D,,/ es continua en a, 
tenemos D i; /(« + cy) D i} f(a ) cuando y -*■ O, así que E 2 (a, /) 0 cuando 
y -*• O. Esto completa la demostración. 
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9.11 Determinación de la naturaleza de un punto estacionario por medio de los 
autovalores de la matriz hessiana 

En un punto estacionario tenemos V f(à) = 0 , así que la fórmula de Taylor 
de la ecuación (9.35) toma la forma 

/(« + y) -/(«) = hyH(a)y* + \\y\\ 2 E 2 (a, y). 

Puesto que el término de corrección lbl| 2 E 2 (a,y) tiende hacia cero más rápida- 
mente que ||y|| 8 , parece razonable pensar que para y pequeno el signo algebraico 
de f(a + jí) — /(«) es el mismo que el de la forma cuadráticaj// (a)j ! ;por lo que 
la naturaleza del punto estacionario podrá determinarse mediante el signo alge- 
braico de la forma cuadrática. Esta sección se dedica a demostrar este hecho. 

Damos primero una conexión entre el signo algebraico de una forma cuadrá- 
tica y sus autovalores. 

teorema 9.5. Sea A = [a„] una matriz nXn simétrica, y pongamos 
ÔOO = yAý = 2 ■ 


Tenemos entonces: 

a) QOO > 0 para todo y O si y sólo si todos los autovalores de A son 
positivos. 

b) Q(y) < 0 para todo y jí O si y sólo si todos los autovalores de A son 
negativos. 


Observación. En el caso a), la forma cuadrática se llama definida positiva; en el 
caso b) se llama definida negativa. 


Demostración. En virtud del teorema 5.11 existe una matriz ortogonal C 
que reduce la forma cuadrática yAy* a forma diagonal. Esto es 

(9.38) Q(y) = yAý = | A,x 2 

donde x = (x lt ..., x n ) es la matriz fìla x = yC, y k lt ..., k n son los autovalores 
de A. Los autovalores son reales puesto que A es simétrica. 

Si todos los autovalores son positivos, la ecuación (9.38) pone de manifiesto 
que Q(y) > 0- siempre que x ^ O. Pero como jc = yC, tenemos y = xC~\ por 
1° que xj£ O, si y sólo si y je o. En consecuencia Q(y) > 0 para todo y ^ O. 
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Recíprocamente, si Q(ý) > 0 para todo y O podemos elegir y de modo 
que x = yC es el íc-ésimo vector coordenado e k . Para este y, la ecuación (9.38) 
nos da Q(y) = X k , de modo que cada A* > 0. Esto demuestra la parte a). La de- 
mostración de b) es análoga. 

E1 teorema que sigue relaciona la naturaleza de un punto estacionario con 
el signo algebraico de la forma cuadrática yH(à)y*. 

teorema 9.6. Sea f un campo escalar con derivadas parciales segundas 
continuas Dijf en una n-bola B(a), y designemos con H(a) la matriz hessiana en 
un punto estacionario a. Tenemos entonces: 

a) Si todos los autovalores de H(a) son positivos, f tiene un mínimo re- 
lativo en a. 

b) Si todos los autovalores de H(a) son negativos, f tiene un máximo re- 
lativo en a. 

c) Si H(a) tiene autovalores positivos y negativos, f tiene un punto de en- 
silladura en a. 

Demostración. Pongamos Q(y) = yH(a)y*. La fórmula de Taylor nos da 

(9.39) /(« + y) - f(a) = iQ(y) + lb || 2 E t (a, y), 

en donde E 2 (a,y)-r 0 cuando y -+ O. Vamos a demostrar que existe un número 
positivo r tal que, si 0 < ||j>|| < r, el signo algebraico de /(« + j) — /(«) es el 
mismo que el de Q(ý). 

Supongamos primero que todos los autovalores +,..., de H (a) son posi- 
tivos. Sea h el autovalor más pequeno. Si u < h, los n números 

— u .A n — u 

son también positivos. Esos números son los autovalores de la matriz real simé- 
trica H(a) — ul, siendo / la matriz identidad n,Xn. Según el teorema 9.5, la for- 
ma cuadrática y[H(a) — ul]y‘ es definida positiva, y por tanto y[H(a) — ul]y*> 0 
para todo y j* O. Por lo tanto 

yH(a)y* > y(ul)y* = u 113-11 2 

para todo valor real u < h. Tomando u = \h obtenemos la desigualdad 

Qiy) > \h llj-ll 2 

para todo y ^ O. Puesto que E 2 (a, y)->-0 cuando y-+ O, existe un número 
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positivo r tal que \E t (a,ý)\ < \h con tal que 0 < ||j'|| < r. Para tal y tenemos 


0 ^ II:Pir l^(«, y)\ < ìh Ibll* < \Q(y), 

y la fórmula de Taylor (9.39) demuestra que 

/(« + y) -/(«) ^ ÏQ(y) - llyll 2 \E,(a, y )\ > o. 

Por consiguiente / tiene un mínimo relativo en a, lo que demuestra la parte a). 
Para probar b) podemos utilizar un razonamiento parecido, o aplicando simple- 
mente la parte a) a —/. 

Para demostrar c), sean h y X 2 dos autovalores de H(a) de signos opuestos. 
Pongamos h = min {IXj, lA^I}. Entonces para cada valor real u que satisfaga 
—h<u<h los números 


*i - « y h~u 

son autovalores de signos opuestos de la matriz H(a) — ul. Por consiguiente, si 
u e ( — h, h), la forma cuadrática y[/í(a) — ulfy* toma valores positivos y ne- 
gativos en todo entorno de y = O. Elijamos, como antes, r > 0 de modo que 
\Ei(a,y)\ < ih siempre que 0 < ||y|| < r. Razonando, entonces, como antes ve- 
mos que para tal y el signo de f(a + y) — f(a) es el mismo que el de Q(y). 
Puesto que para y -► 0,se presentan valores positivos y negativos, / tiene en« 
un punto de ensilladura. Esto completa la demostración. 


Observación: Si todos los autovalores de H(a) son cero, el teorema 9.6 no 
nos da información relativa al punto estacionario. Se pueden dar criterios, para 
tratar tales ejemplos, en los que intervienen derivadas de orden superior, pero no 
los expondremos aquí. 


9.12 Criterio de las derivadas segundas para determinar extremos de funciones 
de dos variables 

En el caso n = 2 la naturaleza del punto estacionario se puede determinar 
también mediante el signo algebraico de la derivada segunda D x ,f(a) y del 
determinante de la matriz hessiana. 


teorema 9.7. Sea a un punto estacionario de un campo escalar f(x u x t ) 
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con derivadas parciales segundas continuas en una 2-bola B(a). Designemos con 


y sea 


A = D ítl f(a), B = D 1A f(a ), C = />„/(«), 


A = det H(a) = det 



= AC — B 2 . 


Tenemos entonces: 

a) Si A < 0, / tiene un punto de ensilladura en a. 

b) Si A > 0 y A > 0, / tiene un mínimo relativo en a. 

c) Si A > 0 y A < 0, / tiene un máximo relativo en a. 

d) Si A = 0 ,' el criterio no decide nada. 

Demostración. En este caso la ecuación característica det [A/ — H(a)] = 0 
es cuadrática. 


A* - (A + C)A + A = 0. 

Los autovalores K, K están ligados a los coeficientes por las ecuaciones 

K + 4 = A + C, = A. 

Si A < 0 los autovalores tienen signos opuestos, así que / tiene un punto de ensilla- 
dura en a, lo que prueba a). Si A > 0, los autovalores tienen el mismo signo. En 
este caso AC > B 2 > 0, así que A y C tienen el mismo signo. Este signo debe ser 
el de Aï y ya que A + C = K Esto demuestra b) y c). 

Para demostrar d) nos referiremos a los ejemplos 4 y 5 de la sección 9.9. En 
ambos tenemos A = 0 en el origen. En el ejemplo 4 el origen es un punto de ensilla- 
dura, y en el ejemplo 5 es un mínimo relativo. 

Aun cuando sea aplicable el teorema 9.7 puede ocurrir que no sea éste el ca- 
mino más sencillo para determinar la naturaleza de un punto estacionario. Por 
ejemplo, cuando f(x, y) = en donde g(x, y) = x 2 + 2 + cos 2 y — 2 cos y, 

el criterio es aplicable, pero los cálculos son muy largos. En este caso podemos 
expresar g(x, y) como una suma de cuadrados escribiendo g(x, y) = 1 + x 2 + 
+ (1 — cos y f. En seguida vemos que / tiene máximos relativos en los puntos en 
los que x 2 = 0 y (1 — cos yf = 0. Estos son los puntos (0, 2n+), siendo n un en- 
tero cualquiera. 

9.13 Ejercicios 

En los ejercicios del 1 al 15, identifìcar y clasificar (si existen) los puntos estacionarios 
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de las superfìcies que tienen las ecuaciones cartesianas que se dan. 


1. z =* 2 + 0- - l) 2 . 

2. z=x*-(y- l) 2 . 

3. z = 1 + x 2 -f. 

4. z = (x -y + l) 2 . 

5. z = 2x 2 - xy - 3 y 2 - 3x + 7 y. 

6. z = x 2 — xy + y 2 — 2x + y. 

13. z =senxsenysen(x + y), O^x^n, 

14. z = x — 2y + log yjx 2 + y 2 + 3 arctan^ , 

15. z =(x 2 + . 


7. z=x? - 3xy 2 +f. 

8. z =x 2 f(6 -x -y). 

9- z = x? + f — 3 xy. 

10. z = senxcoshj. 

11. x - e 2 ^(%x 2 - 6 xy + 3/). 

12. z = (5x +ly - 25)e-<* , +*»+»’>. 
0 <,y <. n. 

x >0. 


16. Sea f(x, y) = 3x* — 4x 2 y + y 2 . Demostrar que sobre toda recta de la forma y = mx la 

función tiene un mínimo en (0,0), pero que no existe mínimo relativo en ningún entomo 
bidimensional del origen. Hacer un dibujo indicando el conjunto de puntos (x, y) en los 
que f(x, y) > 0 y el conjunto en el que f(x, y) < 0. 

17. Sea f(x, y) = (3 - x)(3 - y)(x + y - 3). 

a) Trazar una figura indicando el conjunto de puntos (x, y) en los que f(x,y) > 0. 

b) Hallar todos los puntos (x, y) del plano en los que D,f(x, y) = Dif(x, y) = 0. 

E. Indicación. D,f(x, y) contiene (3 — y) como factor.] 

c) iCuáles de los puntos estacionarios son máximos relativos? iCuáles son mínimos 
relativos? iCuáles ni una cosa ni otra? Razonar las contestaciones. 

d) iTiene / un mínimo absoluto o un máximo absoluto en todo el plano? Razonar la 
contestación. 

18. Determinar todos los valores extremos absolutos y relativos y los puntos de ensilladura 
para la función f(x,y) = xy(l - x 2 - ỳ 2 ) en el cuadrado 0<x<l, 0<y<l. 

19. Determinar las constantes a y b para que la integral 


^{ax+b-f(x)) 2 dx 


tome el valor menor posible si a) f(x) = x 2 ; b) f(x) = (x 2 + l)-‘. 

20. Sea f(x,y) = Ax 2 + 2Bxy + Cf + 2 Dx + 2 Ey + Fe n donde A > 0 y B 2 < AC. 

a) Demostrar que existe un punto (xi.yf) en el que / tiene un mínimo. [ Indicación. 
Transformar la parte cuadrática en una suma de cuadrados.] 

b) Demostrar qu ef(xi,yd = Dx x + Ey x + F en ese mínimo. 

c) Demostrar que 

A B D 
B C E . 

D E F 

21. Método de los mínimos cuadrados. Dados n números distintos x ,...,x„ y otros n nú- 
meros y,,...,y„ (no necesariamente distintos), es en general imposible encontrar una 
recta f(x) = ax + b que pase por todos los puntos (xi,yi), esto es, tal que f(x,) =y, para 
cada i. No obstante, podemos encontrar una función lineal con la que el «error cua- 
drático total» 


f(*.yù = 


E(a,b)=2 t/fe) -Fif 
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sea mínimo. Determinar los valores de a y b para que eso ocurra. 

22. Extender el método de los mínimos cuadrados a E,. Esto es, hallar una función lineal 
f(x, y) = ax + by + c que minimice el error cuadrático total 

E(a, b, c) = J lf(Xi, yì) - z,] 2 , 

donde (x it yi) son n puntos distintos dados y z x ..... z„ son n números reales dados. 

23. Sean zi..... z. n puntos distintos en un m-espacio. Si x e R m , defìnamos 

f(x) - 2II* - **ll 2 - 


Demostrar que f tiene un mínimo en el punto a = - / Zj(centroide). 

24. Sea a un punto estacionario de un campo escalar / con derivadas parciales segundas en 
una n-bola B(a). Demostrar que / tiene un punto de ensilladura en a si por lo menos 
dos elementos de la diagonal principal de la matriz hessiana H(a) tienen signos opuestos, 

25. Comprobar que el campo escalar f(x, y,z) = X? + y' + z' — 4 xyz tiene un punto esta- 
cionario en (1,1,1), y determinar la naturaleza de ese punto estacionario calculando los 
autovalores de su matriz hessiana. 


9.14 Extremos ctmdicionados. Multiplicadores de Lagrange 

Iniciamos esta sección con dos ejemplos de problemas de extremos condi- 
cionados. 

ejemplo 1. Dada una superficie S que no pase.por el origen, determinar los 
puntos de S más próximos al origen. 

ejemplo 2. Si f(x, y, z ) representa la temperatura en (x, y, z), determinar 
los valores máxïmo y mínimo de la temperatura en una curva dada C del espacio 
de tres dimensiones. 

Ambos ejemplos son casos particulares del siguiente problema general: De- 
terminar los valores extremos de un campo escalar f(x) cuando x tiene la restric- 
ción de pertenecer a un subconjunto dado del dominio de f. 

En el ejemplo 1 el campo escalar cuyo mínimo se desea es la función distancia, 
f(x,y, z) = (x 2 +'/ + z 2 )î4; 

el subconjunto restringido es la superficie dada S. En el ejemplo 2 tal subconjunto 
es la curva dada C. 





384 Aplicaciones de cálculo diferencial 

Con frecuencia los problemas de extremos condicionados son muy difíciles; 
no se conoce un método general para resolverlos con toda generalidad. Se utilizan 
métodos particulares cuando el subconjunto restringido tiene una estructura sen- 
cilla, por ejemplo, si es una superficie como en el ejemplo 1, o una curva como en 
el ejemplo 2. Esta sección está dedicada al método de los multiplicadores de La- 
grange para resolver tales problemas. Ante todo exponemos el método en su 
forma general, y luego damos argumentos geométricos para comentar su aplicación 
a los dos ejemplos antes mencionados. 

Método de los multiplicadores de Lagrange. Si un eampo escalar /(x T ,. . ., x„) 
tiene un extremo relativo cuando está sometido a m condiciones, por ejemplo 

(9.40) £i(*i. x„) = 0, . .. , g m (x 1; ... , x n ) = 0, 

siendo m < n, existen entonces m escalares ..., A m tales que 

(9.41) V/= V gl + • • • + X m \g m 
en cada punto extremo. 

Para determinar los puntos extremos en la práctica consideramos el sistema 
de n + m ecuaciones formado con las m ecuaciones de condición (9.40) y las n 
ecuaciones escalares determinadas por la relación vectorial (9.41). Se resuelve 

el sistema (si ello es posible) respecto a las n + m incógnitas x t . x„ y 

<'• 1 ,..., A. m . Los puntos (x t ,, x„) en los que se presentan los extremos relativos 
se encuentran entre las soluciones de aquél sistema. 

Los escalares X u ... ,\ m que se introdujeron para ayudarnos a resolver este 
tipo de problema se denominan mulliplicadores de Lagrange. Se introduce un 
multiplicador por cada condición. E1 campo escalar / y las funciones de condición 
gl ,... ,g m se suponen diferenciables. E1 método es válido si el número de condi- 
ciones, m, es menor que el número de variables, n, y si no todos los determinantes 
jacobianos de las funciones de condición con respecto a m de las variables 
x u ... ,x„ son nulos para los valores extremos que se consideran. La demostra- 
ción de la validez del método es un resultado importante del cálculo superior y 
no la expondremos aquí. (Véase el capítulo 7 de la obra del autor Análisis mate- 
mático, Editorial Reverté, S. A., Barcelona, Buenos Aires, Caracas, México. En lu- 
gar de ello daremos unos argumentos geométricos para hacer ver el significado del 
método y cómo se aplica en los dos ejemplos que al principio se han citado. 

Solución geométrica del ejemplo 1. Queremos determinar los puntos de una 
superftcie dada S que están más próximos al origen. Un punto (x, y, z) del espacio 
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de tres dimensiones está a distancia r del origen si y sólo si está en la esfera 
x* +y* + z* = r 2 . 

Esta esfera es una superfìcie de nivel de la función f(x, y, z) = (x 2 + y 2 + z 2 ) v ‘ 
que hay que minimar. Si empezamos con r = 0 y aumentamos r hasta que la 
correspondiente superfìcie de nivel sea tangente a la superficie dada S, cada punto 
de contacto será un punto de S lo más próximo al origen. 

Para determinar los puntos de contacto suponemos que S está definida por 
la ecuación cartesiana g(x, y, z) = 0. Si S tiene plano tangente en un punto de 
contacto, dicho plano también debe ser tangente a la superficie de nivel tangente 
a S en el mismo punto. Por lo tanto el vector gradiente de la superficie 
g(x, y, z) = 0 debe ser paralelo al vector gradiente de la superficie de nivel de 
contacto f(x, y, z) = r. Por tanto existe una constante X tal que 

Vf(x,y,z) = X Vg(x,y, z) 

en cada punto de contacto. Esa es la ecuación vectorial (9.41) lograda con el 
método de Lagrange cuando hay una sola condición. 

Solución geométrica del ejemplo 2. Queremos obtener los valores extremos 
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de una función que da la temperatura f(x, y, z) sobre una curva dada C. 
Si consideramos la curva C como la intersección de dos superficies, 

gjx, y, z) = 0 y g 2 (x, y, z) = 0, 

tenemos un problema de extremos con dos condiciones. Los dos vectores gradien- 
tes Vgj y V g 2 son normales a esas superficies, luego también lo son a la curva 
C de intersección. (Ver figura 9.8). Seguidamente demostramos que el vector gra- 
diente V/ de la función temperatura también es normal a C en cada extremo re- 
lativo sobre C. Ello implica que V f está en el mismo plano que Vg* y Vg 2 ; luego 
si Vgj y Vg 2 son independientes podemos expresar V / como combinación lineal 
de Vgj y Vg 2 , es decir 

V/= Wgi + A 2 Vg 2 . 


Ésta es la ecuación vectorial (9.41) obtenida con el método de Lagrange cuan- 
do existen dos condiciones. 

Para demostrar que V/ es normal a C en un punto extremo imaginemos 
que C esté definida por una función vectorial <x(t), variando t en un intervalo 
[a, b]. Sobre la curva C la temperatura se convierte en una función de t, es decir 
<p(t) = f[a(t)] . Si <p tiene un extremo relativo en un punto interior t x de[a, b] 
tiene que verificarse <p’(tt) = 0. Por otra parte, la regla de la cadena nos dice que 
<p'(t) viene dada por el producto escalar 

<P’(0 = V/[a(í)] ■ o'(0- 

Este producto es nulo en t u luego V/ es perpendicular a a!(t). Pero a'(íi) es tan- 
gente a C, por lo que V/ [aO!)] está en el plano normal a C, como muestra la 
figura 9.9. 

Los dos vectores gradientes Vgj y Vg 2 son independientes si y sólo si su 
producto vectorial es no nulo. Este producto viene dado por 


Vgi 


i j k 


Vg 2 = 


3gi 3gi 3gi 
dx dy dz 
3g 2 dg 2 dg 2 
dx dy 3z 


d (Si » ga) . , g(gi, g 2 ) . g(gi, g 2 ) , 

3(y, z) 3(z, x) d(x, y) 


Por consiguiente, la independencia de Vg t y Vg^ significa que no todos los de 
terminantes jacobianos del segundo miembro son cero. Como ya hemos observado. 
el método de Lagrange es aplicable siempre que esta condición se satisfaga. 
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Si V gl y Vg 2 son dependientes el método puede fallar. Por ejemplo, supon- 
gamos que intentamos la aplicación del método de Lagrange para encontrar los 
valores extremos de f(x, y, z) = x 1 2 + / en la curva de intersección de las dos 
superfìcies gl (x, y, z) = 0 y &(x, y, z) = 0 siendo gl (x, y, z) = z y g 2 (x, y, z) t= 
2 * 2 — (y — i) 3 4 5 . Las dos superficies, un plano y un cilindro, se cortan a lo largo 
de la recta C dibujada en la figura 9.10. E1 problema tiene evidentemente una 



Figura 9.10 Ejemplo ert el que el método de Lagrange no es aplicable. 

solución, debido a que f(x, y, z) representa la distancia del punto (x, y, z) al eje z 
y esta distancia es un mínimo sobre C cuando el punto es el (0, 1,0). Sin em- 
bargo, en este punto los vectores gradientes son V gl = k, Vg 2 = O, y V/ = 2j, 
y está claro que no existen escalares y A 2 que satisfagan la ecuación (9.41). 

9.15 Ejercicios 


1. Hallar los valores extremos de z = xy con la condición x + y = 1. 

2. Hallar las distancias máxima y mínima desde el origen a la curva 5+ + 6xy + 5y 2 = 8. 

3. Supongamos que a y b son números positivos fijos. 

a) Hallar los valores extremos de z = x/a + y/b con la condición x 2 + y 2 = 1. 

b) Hallar los valores extremos de z= x 2 + y 2 con la condición x/a + y/b = 1. 

En cada caso, interpretar geométricamente el problema. 

4. Hallar los valores extremos de z = cos 2 x + cos 2 y con la condición x — y = tt/4. 

5. Hallar los valores extremos del campo escalar f(x, y, z) = x — 2y + 2z en la esfera 
X 2 + y 2 + Z 2 = 1. 
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6. Hallar los puntos de la superficie z 2 — x y = 1 más próximos al origen. 

7. Hallar la mínima distancia desde el punto (1,0) a la parábola y 2 = 4x. 

8. Hallar los puntos de la curva de intersección de las dos superficies 

x 2 - xy + f - z* = 1 y x 2 + f = 1 

que están más próximos al origen. 

9. Si a, b y c son números positivos, hallar el valor máximo de f(x, y, z) = x°y b z e con la 
condición x + y + r = 1. 

10. Hallar el volumen mínimo limitado por'los planos x = 0, y = 0, z = 0, y un plano 
que sea tangente al elipsoide 


+ 5 + ? = 


en un punto del octante x > 0, y > 0, z > 0. 

11. Hallar el máximo de logx + logy + 3 logz en la porción de la esfera x 2 + y 2 + z 2 = 5r* 
en la que x > 0, y > 0, z > 0. Aplicar el resultado para demostrar que para números 
reales positivos a, b,c tenemos 


«fc* £ 27(î±}±fJ. 

12. Dada la sección cónica Ax 2 + 2Bxy + Cỳ 2 = 1, siendo A > 0 y B 2 < AC. Represente- 
mos con m y M las distancias mínima y máxima desde el origen a los puntos de la 
cónica. Demostrar que 


A+C + sJ(A - C) 2 + 4 B 2 
2(AC - B *) 

y hallar una fórmula análoga para m 2 . 

13. Aplicar el método de los multiplicadores de Lagrange para hallar las distancias máxi- 
ma y mínima de un punto de la elipse x 2 + 4/ = 4 a la recta x + y = 4. 

14. La sección de un canal es un trapecio isósceles. Si los lados iguales de ese trapecio 
miden c metros, icuál debe ser el ángulo que forman éstos con el fondo (base menor 
del trapecio) si queremos que el área de la sección sea máxima? 


9.16 Teorema del valor extremo para campos escalares continuos 

E1 teorema del valor extremo para funciones reales continuas en un intervalo 
acotado y cerrado puede extenderse a campos escalares. Consideremos campos 
escalares continuos en un intervalo «-dimensional cerrado. Tal intervalo se de- 
fine como el producto cartesiano de n intervalos uni-dimensionales cerrados. Si 
a = ( fl i, • • •» On) y b = (&!,..., b„) escribimos 

[a, *] = [ûi, bj] X • • • x [a n , b n ,| = {(xl ..., xj | e [o lt éj,..., jc„ e [a n , b n ]}. 



Teorema del valor extremo para campos escalares continuos 


389 


Por ejemplo, cuando n = 2 el producto cartesiano [a, b] es un rectángulo. 

La demostración del teorema del valor extremo es paralela a la demostra- 
ción dada en el volumen I para el caso unidimensíonal. Demostramos primero que 
la continuidad de / implica la acotación, luego probamos que / alcanza efectiva- 
mente sus valores máximo y mínimo en [«, b]. 

TEOREMA 9.8. TEOREMA DE ACOTACIÓN PARA CAMPOS ESCALARES CONTINUOS. 
Si f es un campo escalar continuo en cada punto de un interválo cerrado [a, b] 
de R", entonces f es acotada en [a, *]. Esto es, existe un número C ^ 0 tal que 
|/(x)K C para todo x de [a, *]. 

Demostración. Razonemos por reducción al absurdo, utilizando el método de 
la bisección sucesiva. La figura 9.11 representa el método para el caso n = 2. 

Supongamos que / no esté acotada en [a, é]. Pongamos / (1) = [a, ft] e 
I {1) = [a k , b k ], así que 

/ (I > = / ( 1) X ••• xl™. 

Dividamos en dos partes iguales cada intervalo unidimensional I {1) formando 
dos subintervalos, la mitad izquierda /^ y la mitad derecha /£>. Considere- 
mos ahora todos los productos cartesianos posibles de la forma 

/ ( i>, x X InJ„, 



Figura 9.11 Representación en el plano del método de la bisección sucesiva. 
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en donde cada j, = 1 ó 2. Existen exactamente 2" productos de este tipo. Cada 
uno de ellos es un subintervalo «-dimensional de [a, b], y su reunión es igual a 
[®> La funcion / no esta acotada en uno por lo menos de esos subintervalos 
(si estuviera acotada en cada uno de ellos también estaría en [ a, h}). Designemos 
por / (2 > uno de ellos que expresamos del modo siguiente 


/(« = /(*> x ... x /(Z)^ 


en donde cada I[ 2) es uno de los subintervalos unidimensionales de / (1 > t de 
longitud \(b k — a k ). 

Seguidamente hacemos con / ,2 > lo mismo que con / (1 >, bisecamos cada com- 
ponente unidimensional /«' y Uegamos a un intervalo n-dimensional / (3) en el 
que / no está acotada. Prosiguiendo este proceso, obtenemos un conjunto infinito 
de intervalos «-dimensionales 

/ m , / ,2) ,... , tales que /<”<+ j > ç /<>»4 

en cada uno de los cuales / no está acotada. E1 intervalo m-ésimo / (m > puede ex- 
presarse en la forma 


/ (m > = I[ m> x ••• x / (B ». 

Como quiera que cada intervalo unidimensional I { k m) se obtiene mediante m — 1 
bisecciones sucesivas de [a*, &*], si escribimos I {m) = [a (m, t /> ,m, ]tenemos 

, (m) (m) K - a„ 

( 9 - 42 ) b k — a k= > P ara k = 1,2,..., n . 


Para cada /c fija, el extremo superior de todos los extremos izquierdos a[ m) (m m 
1,2,...) debe ser igual al extremo inferior de todos los extremos derechos b[ m) 
(m = 1, 2,...), y designamos su valor común con 4 , E1 punto t = (4 ,... j n ) 
está contenido en [«, b]. En virtud de la continuidad de / en t existe una «-bola 
B(t; r) en la que tenemos 

!/(*) —/(01 < 1 para todo x de B(t; r) n [a, b]. 

Esta desigualdad implica 

!/(*)I < 1 + 1/(01 para todo x deB(t; r) n [a, b], 
c°n lo que / no está acotada en el conjunto B(t; r) n [a, b] . Pero este conjunto 
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contiene todo el intervalo / (m) cuando m es lo bastante grande para que cada uno 
de los n números (9.42) sea menor que r/ yfn. Por consiguiente para ese valor de 
m la función / no está acotada en / (m) , lo que está en contradicción con el hecho 
de que / está acotada en / (m) . Con ello se completa la demostración. 

Si / está acotada en [ a , b], el conjunto de todos los valores f(x) es un con- 
junto de números reales acotado superior e inferiormente. Por consiguiente ese 
conjunto tiene un extremo superior y un extremo inferior que designamos con 
sup / e inf /, respectivamente. Esto es, escribimos 

sup/ = sup { f(x) | x e [a, A]}, inf/ = inf { f(x) \ x e [«, A]}. 

Ahora vamos a demostrar que una función continua alcanza los valores inf / y 
sup / en [a, b). 

TEOREMA 9.9. TEOREMA DEL VALOR EXTREMO PARA CAMPOS ESCALARES. Si 
f es continua en un intervalo cerrado [a, b] de R n , entonces existen puntos c y d 
en [a, b] tales que 


/(c) = sup/ y f(d) = inf/. 

Demostración. Basta demostrar que / alcanza su extremo superior en [«,*]. 
E1 resultado para el extremo inferior se deduce como una consecuencia debido 
a que el extremo inferior de / es el extremo superior de —/. 

Pongamos M = sup /. Supondremos que en [ a, b] no existe ningún x para 
el que f(x) — M y obtendremos una contradicción. Pongamos g(x) — M — f(x). 
Para todo x de [«, b] es entonces g(x) > 0 de modo que la función recíproca 
1/g es continua en [a, £]. Según el teorema de acotación, 1/g está acotada en 
[a, b], sea 1 /g(jc) < C para todo x de [a, *], siendo C > 0. Esto implica que 
M - f(x) > 1/C, con lo que f(x) < M — 1/C para todo x de [ a, b]. Esto con- 
tradice el hecho de que M es la menor cota superior de / en [a, b]. Luego 
f(x) = M para un x por lo menos de [«, *]. 

9.17 Teorema de la continuidad uniforme para campos escalares continuos 

Sea / continua en un intervalo cerrado acotado [«, b] en R”, y designemos 
con M(f) y m(f), respectivamente, los valores máximo y mínimo de / en [«, b]. 
La diferencia 


M(f) - m(f) 


llama oscilación de / en [«, b]. Como en el caso unidimensional tenemos un 
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teorema de la oscilación uniforme para funciones continuas, que nos dice que 
en el intervalo [ a, b] puede efectuarse una partición de modo que la oscilación 
de / en cada subintervalo sea tan pequena como se quiera. 

Pongamos [a, b] = [a lf fej X ... X [a„, 6 „], y sea P k una partición del 
intervalo [a k , b k ]. Esto es, P k es un conjunto de puntos 

p k = • • • , x r _!, x T } 

tales que a k = x 0 < < ... < x r -! < x r = b k . E1 producto cartesiano 

p = p lX ■■ x P n 

se denomina partición del intervalo [a, b] . E1 teorema de la oscilación uniforme 
se suele llamar de la continuidad uniforme, y toma la siguiente forma. 

teorema 9.10. Si f es un campo escalar continuo en un intervalo cerradc 
[a, b] de R", entonces para todo e > 0 existe una partición de [a, b] en un nú- 
mero finito de subintervalos tales que la oscilación de f en todo subintervalo es 
menor que e. 

Demostración. La demostración es del todo análoga al caso unidimensional, 
así que únicamente esbozamos los principales pasos. Razonamos por reducción 
al absurdo, con el método de la bisección sucesiva. Suponemos que el teorema es 
falso; esto es, suponemos que para un cierto e 0 en el intervalo [«, b] no puede 
efectuarse una partición en un número fìnito de subintervalos en cada uno de los 
cuales la oscilación de / es menor que «o- Por bisección sucesiva obtenemos un 
conjunto infinito de subintervalos / (1) , / (2) ,..., en cada uno de los cuales la 
oscilación de / es por lo menos c 0 . Considerando la menor cota superior de los 
extremos izquierdos de los intervalos componentes de. / (1) , / (2) ,.... obtenemos 
un punto t de [a, b] perteneciente a todos estos subintervalos. En virtud de la 
continuidad de / en / existe una «-bola B(t; r)tal que la oscilación de / es menor 
que en B(t;r) n [a, b]. Pero, cuando m es suficientemente grande, el inter- 
valo / (m) está contenido en el conjunto B(t; r) n [a, b\, por lo que la oscilación 
de / no supera a Je 0 en / (m) , lo que está en contradicción con el hecho de que la 
oscilación de / es por lo menos e„ en / (m) . 
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10.1 Introducción 

En el volumen I estudiàmos la integral f(x) dx, primero para funciones 
reales definidas y acotadas en intervalos fìnitos, y luego para funciones no acota- 
das e intervalos infinitos. Posteriormente el concepto se extendió a funciones 
vectoriales y, en el capítulo 7 del volumen II, a funciones matriciales. 

Este capítulo extiende la noción de integral en otra dirección. E1 intervalo 
[a, 6] se reemplaza por una curvaenel espacio n-dimensional definida por una 
función vectorial a, y el integrando es un campo vectorial / definido y acotado 
en esa curva. La integral que resulta se llama integral de línea, integral curvilí- 
nea o integral de contorno, y se emplea para ella la notación ff-dao algún otro 
símbolo parecido. E1 punto se usa precisamente para sugerir el producto interior 
de dos vectores. La curva se llama camino de integración. 

Las integrales de línea son de capital importancia en Matemática pura y 
aplicada. Se presentan al estudiar el trabajo, la energía potencial, el flujo de 
calor, el cambio en la entropía, la circulación de un fluido, y otras cuestiones 
físicas en las que se estudia el comportamiento de un campo escalar o vectorial 
a lo largo de una curva. 

10.2 Caminos e integrales de línea 

Antes de definir las integrales de Iínea recordemos la definición de curva 
dada en el volumen I. Sea a una función vectorial definida en un intervalo cerrado 
finito J — [a, &]. Cuando t va tomando los valores de /, la función a (t) describe 
un conjunto de puntos en el n-espacio llamado gráfica de la función. Si a es 
continua en / la gráfica se llama curva; con mayor precisión, es la curva descrita 
por a. 

En nuestro estudio de las curvas en el volumen I vimos que funciones dis- 
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tintas pueden originar el trazado de la misma curva en formas distintas, por ejem- 
plo, en direcciones distintas o con velocidades distintas. A1 estudiar las integrales 
de línea nos interesa no sólo el conjunto de puntos de una curva sino la manera 
como tal curva ha sido originada, esto es, la función a. Una tal función se llama- 
rá camino continuo. 

definición. Sea ] = [a, 6] un intervalo cerrado finito de R 1 . Una fun- 
ción a:J -» R n continua en J se llama camino continuo en el n-espacio. El camino 
se llama regular si existe la derivada a' y es continua en el intervalo abierto ( a , b). 
El camino se llama regular a trozos si el intervalo [fl, b] puede descomponerse en 
un número finito de subintervalos en cada uno de los cuales el camino es regular. 

La figura 10.1 muestra la gráfica de un camino regular a trozos. En este 
ejemplo la curva tiene recta tangente en todos los puntos excepto en un número 
finito de ellos. Esos puntos excepcionales subdividen la curva en arcos, a lo largo 
de cada uno de los cuales la recta tangente va cambiando de posición con conti- 
nuidad. 


Figura 10.1 Gráfica de un camino regular a trozos en el plano. 

definición de integral de línea. Sea a un camino regular a trozos en 
el n-espacio definido en un intervalo [fl, b], y sea f un campo vectorial definidp 
y acotado sobre la gráfica de a. La integral de línea de f a lo largo de a se repre- 
senta con el símbolo §fday se define por 

(10.1) j f - da = j*f[a(t)] ■ a'(t) dt, 

siempre que la integral del segundo miembro exista, bien como integral propia 
o integral impropia. 

Observación: En muchos ejemplos que en la práctica se presentan el pro- 
ducto interior/[a(f)] • a'(/)está acotado en [a, 6] y es continuo excepto, acaso, 
en un número finito de puntos, en cuyo caso la integral existe como integral propia. 


10.3 Otras notaciones para las integrales de línea 

Si C representa la gráfica de a, la integral de línea J 'f- da también se repre- 
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senta por J c /- da y se llama integral de f alo largo de C. 

Si a = a (a) y b — a(b) representan los puntos extremos de C, a veces la 
integral de línea se expresa poniendo JJ/ o/*/■ da y se denomina integral de 
línea de / desde a a b a lo largo de a. Cuando se use la notación J£ / deberá te- 
nerse en cuenta que la integral depende no solamente de los extremos a y b sino 
también del camino a que los une. 

Cuando « = i el camino se llama cerrado. A menudo el símbolo § se usa 
para indicar la integración a lo largo de un camino cerrado. 

Cuando / yase expresan en función de sus componentes, a saber 

/=C/i,■••,/») y a = (« 1 ,...,«J, 

la integral del segundo miembro de ( 10 . 1 ) se convierte en una suma de integrales, 

Ì P/J«(0K(0 dt. 

*=i 

En este caso la integral de línea también se poneen la forma S fida t -\ -+./„ dan. 

En el caso bi-dimensional ordinariamente el camino a se define con un par 
de ecuaciones paramétricas. 


x — a i(0, J = «a(0, 

y la integral de lineaj c /- da se escribe en la forma Jc/i dx +f 2 dy, o bien 
Scfi(x,y)dx + f 2 (x,y) dy. 

En tres dimensiones se utilizan tres ecuaciones paramétricas 

x = «i(0, y = « 2 (0, 2 = « 3 (0 

y ponemos la integral J c /• da en la forma J c A dx + f 2 dy +f 3 dz , o bien 
Sc /i(*> y> 0 dx + f*(x, y,z)dy+ f 3 (x, y, z) dz. 
ejemplo. Sea /un campo vectorial de dos dimensiones dado por 
f(x, j) = sfy i + (x 3 + y)j 

para todo (x, y) con y ^ 0. Calcular la integral de línea de / desde (0, 0) a (1, 1) 
a lo largo de cada uno de los siguientes caminos: 

a) la recta de ecuaciones paramétricas x = t, y = t, 0<í<l; 

b) el camino de ecuaciones paramétricas x = t 3 , y = t 3 , 0 ^ t ^ í. 
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Solución. Para el camino de la parte a) tomamos <*(/) = ti + tj. Entonces 
a'(t) = i +j y /[«(/)] = y/t i + (t 3 + t)j. Por consiguiente el producto interior 
de /[a(0] P or «'(0 es igual a VT + t 3 + t y encontramos 

£'’'/• da = £Qt + t *+,)dt =. 

Para el camino de la parte b) tomamos a.(t) = t 2 i + t 3 j. Entonces ct'(t) = 
= 2 ti + 3/ 2 y y/[«(r)] = f Á i + (t K + / 3 )y.Por consiguiente 

/[«(/)] • «'(/) = 21* + 3/ 8 + 3/ 5 , 
as í 9 ue (11) x 

Lo) f ^ = Jo (2í ' 4 + 3,8 + 3<5) = 42 • 

Estos ejemplos ponen de manifiesto que la integral desde un punto a otro puede 
depender del camino que los une. 

Calculemos ahora la parte b) una vez más, utilizando la misma curva pero 
con representación paramétrica distinta. Dicha curva puede representarse con la 
función 


(3 (t) = ti + t%j, donde 0 ^/^l. 

Esto nos lleva a la relación 

/[(3(0] ’ P'(0 = (t y, i + (t 3 + t’ A )j) • (í +%t' A j) = t y < + !í H + ìt 3 , 

cuya integral desde 0 a 1 es 59/42, como antes. Esto nos hace ver que el valor 
de la integral es independiente de la representación paramétrica utilizada para la 
curva. Esta es una propiedad general de las integrales de línea que se demuestra 
en la sección siguiente. 

10.4 Propiedades fundamentales de las integrales de línea 

Puesto que las integrales de línea se definen en función de integrales ordina- 
rias, no debe sorprender que aquéllas gocen de muchas de las propiedades de 
éstas. Por ejemplo, tienen la propiedad de linealidad respecto al integrando, 


j (af + bg) • da. = a j f- da + b j g ■ da, 
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y la propiedad aditiva respecto al camino de integración: 

J> da =í Cl fda+ L fda ’ 

donde las dos curvas C, y C 2 forman la curva C. Esto es, C es la gráfica de una 
función a definida en un intervalo [a, fe], y las curvas C x y C 2 son las represen- 
taciones gráficas dea(í) al variar t en los subintervalos [a, c] y [c, b] respectiva- 
mente, para un c que cumple a < c < b. Las demostraciones de estas propieda- 
des son consecuencia inmediata de la definición de la integral de línea; y las de- 
jamos como ejercicios para el lector. 

Seguidamente examinamos el comportamiento de las integrales de línea al 
efectuar un cambio de parámetro. Sea a un camino continuo definido en un inter- 
valo [a, b], sea u una función real derivable, de modo que u’ nunca sea cero en 
un intervalo [c, d], y tal que el recorrido de u sea [a, b]. Entonces la función 
(3 definida en [c, d] por la ecuación 

P(0 = «[«(01 

es un camino continuo que tiene la misma gráfica que a. Dos caminos a y (3 así 
relacionados se llaman equivalentes. Se dice que proporcionan distintas representa- 
ciones paramétricas de la misma curva. Se dice que la función u define un cambio 
de parámetro. 




Figura 10.2 Carnbio de parámetro definido por u = h(t). En a), la función h conserva 
la orientación. En b), la función h invierte la orientación. 
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Sea C la gráfica común de los dos caminos equivalentes a y (3. Si la derivada 
de u es siempre positiva en [c, d] la función u es creciente y decimos que los dos 
caminos a y (3 originan C en la misma dirección. Si la derivada de u es siempre 
negativa decimos que a y |3 originan C en direcciones opuestas. En el primer caso 
se dice que u conserva la orientación; y en el segundo caso que u invierte la orien- 
tación. En la figura 10.2 se muestra un ejemplo. 

E1 teorema siguiente demuestra que una integral de línea no varía al efectuar 
un cambio de parámetro que conserva la orientación; cambia de signo si el cambio 
de parámetro invierte la orientación. Se supone que existen las dos integrales 
Sf-dae J/ dp 

TEOREMA 10.1. COMPORTAMIENTO DE UNA INTEGRAL DE LINEA FRENTE A 
un cambio de parámetro. Si a y )3 son dos caminos equivalentes regulares 
a trozos, entonces se tiene 

Si a y P originan C en la misma dirección; y 

! c /d.=-f c /-dfi 

si a y |3 originan C en direcciones opuestas. 

Demostración. Basta demostrar el teorema para caminos regulares; luego se 
aplica la propiedad aditiva con respecto al camino de integración para deducir el 
resultado para caminos regulares a trozos. 

La demostración es una simple aplicación de la regla de la cadena. Los ca- 
minos a y (3 están ligados por una relación de la forma P(t) = a[u(t)], estando u 
definida en un intervalo [c, d] ya en un intervalo [a, b]. De la regla de la ca- 
dena resulta 


P'(0 = a’[u(t)]u’(t). 

Por consiguiente encontramos 

Sc f' d & = / c VtP(<)] • P'(0 dt = S*f(a[u(t )]) • a’[u(t)]u'(t) dt. 

En la última integral hacemos la sustitución v = u(t), dv = u'(t) dt y se obtiene 
/c f = CV^)) ' ■'(») dv = ±j b a f(a(v)) ■ a'(v) dv = ± /• da , 
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en donde se utiliza el signo + si a = «(c) y b = u{d), y el signo - si a = u(d) 
y b = u(c). E1 primer caso se presenta si a y (3 originan C en la misma dirección, 
el segundo si originan C en direcciones opuestas. 


10.5 Ejercicios 


En cada uno de los ejercicios 1 al 8 calcular la integral de línea del campo vectorial 

/ a lo largo del camino que se indica. 

1. f(x,y) = (x 2 — 2xy)i + (y 2 — 2xy)j, a lo largo de la parábola y = + desde ( — 1,1) 
,a (1,1). 

2. f(x,y) = (2 a - y)i + xj, a lo largo del camino descrito por o (t) = a(t — sen t)i + 
a(l - cos t)j,0 <,t <.2n. 

3. f(x, y, z) = (y 2 — z 2 )i + 2yzj — x 2 k, a lo largo del camino descrito por a(t) = ti 
+ tV +t 3 k I, 0<f<l.| 

4. f(x,y) = (x 2 + y 2 )i + (x 2 - y 2 )j , a lo largo de la curva y = 1 - |1 -x\, desde (0,0) 
a (2,0). 

5- f(x, y) = ( x + y)i + (x — y)j, alrededor de la elipse b 2 x 2 + a 2 y 2 = a 2 b 2 en sentido 
contrario al de las agujas del reloj. 

f(x,y,z) = 2xyi + (x 2 +z)j +yk, desde (1,0,2) a (3,4,1) a lo largo de un seg- 
mento de recta. 

7. f(x,y,z) = xi + yj + (xz —y)k, desde (0,0,0) a (1,2,4) a lo largo de un segmento 
rectilíneo. 

8. f(x,y, z) = xi + yj + (xz — y)k, a lo largo del camino dado por a(t) = t 2 i + 2tj + 
4t 3 k, 0 < t < 1. 


10 . 


En cada uno de los ejercicios 9 al 12, calcular el valor de la integral de línea dada. 

9. i c (** — 2x f) dx + (y 2 — 2xy) dy siendo C el arco de parábola y = x 2 que une 
los puntos (— 2,4) y (1,1). 

J (x + y) dx - (x - y) dy 


donde C es la circunferencia x 1 + y 2 = a 2 , recorrida en 


11. f„£4r! donde c es el contomo del cuadrado de vértices (1,0), (0,1), (-1,0) y 

JC 1*1 + IVII 


x 2 +y 2 

sentido contrario al de las agujas del reloj. 
dx +dy 
1*1 +\y\ | 

(0,-1), recorrido en sentido contrario al de las agujas del reloj. 

12. Scydx + zdy + x dz, donde 

a) C es la curva de intersección de las dos superficies x + y = 2 y x? + y 1 + z 2 = 
= 2(x + y). La curva es recorrida de tal modo que mirando desde el origen el sentido 
es el de las agujas del reloj. 

b) C es la intersección de las dos superficies z = xyy+ + y 2 =l, recorrida en senti- 
do, que visto desde encima del plano xy, es el contrario al de las agujas del reloj. 


10.6 E1 concepto de trabajo como integral de línea 

Consideremos una partícula que se mueve a lo largo de una curva bajo la 
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acción de un campo de fuerzas /. Si la curva es la gráfìca de un camino a, regular 
a trozos, el trabajo realizado por / se define por la integral de línea //■ da. Los 
ejemplos siguientes ponen de manifiesto algunas de las propiedades fundamentales 
del trabajo. 

ejemplo 1. Trabajo realizado por una fuerza constante. Si/es una fuer- 
za constante, a saber / = c , puede demostrarse que el trabajo realizado por / al 
mover una partícula desde un punto a a un punto b a lo largo de cualquier camino 
regular a trozos que una a y b es c • (b — a) producto de la fuerza por el despla- 
zamiento b — a. Lo demostraremos en un caso particular. 

Sea cc = (oq,... , a B ) un camino que una a y b, a saber a(a) = a y a{b) = b, 
y escribamos c — (ci,. .. , c„). Supongamos que a' es continua en [a , b~\. Entonces 
el trabajo realizado por / es igual a 

ìf da = J\c k P a'(r) dt =J,c k [a k (b) — a k (a)] = c • [a(b) — a(a)] = c • (b — a). 


Para este campo de fuerzas el trabajo depende solamente de los puntos extre- 
mos a y b y no de la curva que los une. No todos los campos de fuerza tienen 
esta propiedad. Los que la tienen se llaman conservativos. E1 ejemplo de la pá- 
gina 395 es un campo de fuerzas no conservativo. En una sección posterior deter- 
minaremos todos los campos de fuerzas conservativos. 

ejemplo 2. Principio del trabajo y la energía. Una partícula de masa m 
se mueve a lo largo de una curva bajo la acción de un campo de fuerzas /. Si la 
velocidad de la partícula en el instante t es v(í), su energía cinética está definida 
por l mv 2 (t). Demostrar que la variación de la energía cinética en cualquier inter- 
valo de tiempo es igual al trabajo realizado por f durante dicho intervalo de tiempo. 

Solución. Designemos por r(t) la posición de la partícula en el instante t. 
E1 trabajo realizado por / durante un intervalo de tiempo [a, 6] es $ r r \ b a \f-dr. 
Queremos demostrar que 


f r <*) 

d* = ì mv \h) — imv 2 (a). 

Según la segunda ley del movimiento de Newton tenemos 
fW)ì = mr"(t) = mv'(t), 

donde v(t) designa el vector velocidad en el instante t. La velocidad es la longi- 
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tud del vector velocidad, v(t) =||»(í)||. Por consiguiente 

f[r{t)] ■ r'(t) = f[r(t)] ■ v(t) = mv'(t) ■ v(t) = |my (v(t) ■ v(t)) = im y (v 2 (t)). 

dt dt 

Integrando entre a y b obtenemos 

/;:>• dr = j*f[r(t)] ■ r'(t) dt = \mv 2 (t)\^ = \mv 2 (b) - \mv 2 (a), 
como queríamos probar. 


10.7 Integrales de línea con respecto a la longitud de arco 

Sea a un camino con derivada a' continua en un intervalo [a,b]. La gráfica 
de a es una curva rectificable. En el volumen I se demostró que la correspondiente 
función longitud de arco s, está dada por la integral 

<0 = /; ||«'(«)|| du . 

La derivada de la longitud de arco tiene por valor 

*'(') = II «'(011 • 

Sea <p un campo escalar defìnido y acotado en C, la gráfìca de a. La integral 
de línea de cp con respecto a la longitud de arco a lo largo de C se representa con el 
símbolo îcyds y se define por 

/ c <P ds = /; y[a(r)]s'(í) dt, 


siempre que exista la integral del segundo miembro. 

Consideremos ahora un campo escalar q> dado por <?[a(0] =/[«(01' T (0 
que es el producto interior de un campo vectorial f, defìnido en C, por el vector 
tangente unitario T(t ) = (da/ds) En este caso la integral de línea jccpds coincide 
con esta otraJ c /- da debido a que 

/[a(í)] • a'(t) =/[a(í)] ■ ^ y =/[a(f)] ■ T(t)s’(t) = ^[a(f)]s'(í). 
as dt 

Cuando / representa una velocidad, el producto interior/• Tes el componente 
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tangencial de la velocidad, y la integral de línea $ c f Tdse s la integral de flujo 
de / a lo largo de C. Cuando C es una curva cerrada la integral de flujo es la 
circulación de / a lo largo de C. Estas denominaciones se usan corrientemente en 
la teoría del flujo de fluidos. 

10.8 Otras aplicaciones de las integrales de línea 

Las integrales de línea con respecto a la longitud de arco se presentan también 
en problemas relativos a la distribución de la masa a lo largo de una curva. Por 
ejemplo, imaginemos una curva C en el espacio de tres dimensiones como un 
delgado alambre de densidad variable. Supongamos que la densidad se expresa 
mediante un campo escalar <p, siendo <p{x, y, z ) la masa por unidad de longitud 
en el punto ( x, y, z) de C. La masa total M del alambre viene entonces defìnida 
como la integral de línea de <p con respecto a la longitud de arco: 

M = j c <p(x, y, z) ds . 

E1 centro de gravedad se define como el punto (jc, ŷ, z) cuyas coordenadas están 
determinadas por las ecuaciones 

xM = J c x<p(x, y, z) ds, ŷM = j c y<p(x, y, z) ds, zM = j c z<p(x, y, z) ds. 

Un alambre de densidad constante se llama uniforme. En este caso el centro de 
gravedad también se llama centroide. 

ejemplo 1. Calcular la masa M de un muelle que tiene forma de hélice 
cuya ecuación vectorial es 

a(/) = a cos t i + a sen tj + btk 

si la densidad en (x, y, z) es x 2 + y 2 + z 2 . 

Solución. La integral para calcular M es 

M = J c (x 2 + y 2 + z 2 ) ds = j (a 2 cos 2 1 + a 2 sen 2 1 + b 2 t 2 )s'(t) dt. 

Puesto que s'(t) = ||a'(í)|[ y a '(t) = — a sen ti + acosí/'+ bk, tenemos s'(t) = 
= V a 2 + b 2 y por tanto 

M = V a 2 + b 2 J* (a 2 + b 2 t 2 ) dt = \ a 2 + b 2 ^2na 2 + ^ t r 3 fc 2 j . 
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En este ejemplo la coordenada z del centro de gravedad viene dada por 
ïM = z(x 2 + y 2 + z 2 ) ds = \la 2 + b 2 j** bt(a 2 + b 2 t 2 ) dt 
= b\/a 2 + b 2 (2ir 2 a 2 + 47r 4 f» 2 ). 

La determinación de las coordenadas X e y, se propone como ejercicio 15 en la 
sección 10.9. 

Las integrales de línea se pueden utilizar para definir el momento de inercia 
de un alambre o hilo con respecto a un eje. Si 8(x:, y, z) representa la distancia 
desde un punto (x, y, z) de C a un eje L, el momento de inercia h está definido 
por la integral de línea 


j l = J c ò \x, y, z)tp(x, y, z) ds, 

en donde <p(x, y, z) es la densidad en (x, y, z). Los momentos de inercia respecto 
a los ejes coordenados se representan por I x , I y e I z . 

ejemplo 2. Calcular el momento de inercia I z del muelle del ejemplo 1. 

Solución. Aquí 8 2 (x, y, z) = x 2 + y 2 = a 2 y <p(x, y, z) = x 2 + y 2 + z 2 , así 
que tenemos 

I z = J c (x 2 + y 2 )(x 2 + y 2 + z 2 ) ds = a 2 j c (x 2 + y 2 + z 2 ) ds = Ma 2 , 

en donde M es la masa, como se calculó en el ejemplo 1. 

10.9 Ejercicios 


1. Un campo de fuerzas / del espacio de tres dimensiones viene dado por f(x, y, z)= 
xi + yj + (xz - y)k . Calcular el trabajo realizado por esa fuerza al mover’ una 

partícula desde (0,0,0) a (1,2,4) a lo largo del segmento de recta que une esos puntos. 

2. Hallar el trabajo realizado por la fuerza/ (x, y) =(x ! — g 2 )/ + 2xyj al mover una partícula 
en sentido contrario al de Ias agujas del reloj recorriendo una vez el contorno del 
cuadrado limitado por los ejes coordeqados y las rectas x = aey = a, a>0. 

3. Un campo de fuerzas bidimensional / viene dado por la ecuación/(x, y) =cxyi + x B y 2 j 
siendo c una constante positiva. Esa fuerza actúa sobre una partícula que se mueve 
desde (0,0) hasta la recta x = 1 siguiendo una curva de la forma 

y = ax b , en donde a> 0 y b> 0. 
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Encontrar el valor de a (en función de c) tal que el trabajo realizado por esa fuerza sea 
independiente de b. 

4. Un campo de fuerzas / en el espacio de tres dimensiones viene dado por la fórmula 
f(x,y, z) = yzi + xzj + x(y + l)Ar. Calcular el trabajo realizado por / al mover una 
partícula recorriendo una vez el contorno del triángulo de vértices (0,0,0), (1,1,1), 
( —1,1, — 1) en este orden. 

5. Calcular el trabajo realizado por el campo de fuerzas f(x,y, z) = (y — z)i + (z — x)j 
+(x — y)k a lo largo de la curva de intersección de la esfera x 2 + y 2 + z 1 = 4 y él 
plano z = y tan «, en donde 0 < e < <z/2. E1 camino es recorrido de modo que, obser- 
vado el plano xy desde el eje z positivo, el sentido aparezca contrario al de las agujas 
del reloj. 

6. Calcular el trabajo realizado por el campo de fuerzas f(x,y, z)=y 2 i + z 2 j + x 2 k a lo 
largo de la curva de intersección de la esfera + y 1 + z 1 = u 2 y el cilindro x 2 + y 1 = ax, 
siendo z > 0 y a > 0. E1 camino es recorrido de modo que, observado el plano xy 
desde el eje z positivo el sentido sea el de las agujas del reloj. 

Calcular la integral de línea con respecto a la longitud de arco en cada uno de los ejer- 
cicios del 7 al 10. 

7- í ç(x + y) ds, siendo C el triángulo de vértices (0,0), (1,0) y (0,1), recorrido en sentido 
contrario al de las agujas del reloj. 

8. J c y ! ds, en donde C tiene la ecuación vectorial 


a(í) = a(t - sen t)ì + a(l - cos t)j, 0 <, t <, 2*. 

9' Í C (* J + y ! ) ds, donde C tiene la ecuación vectorial 

a(t) = a(cost + tsent)i + a(sent — tcost)j, 0 <, t ^ 2w. 

10. J c z ds, donde C tiene la ecuación vectorial 

a(t) = tcosti + tsentj + tk, 0£t<,t 0 . 

11. Consideremos un alambre semicircular uniforme de radio a. 

a) Demostrar que el centroide está situado en el eje de simetría a una distancia 2a/rr 
del centro. 

b) Demostrar que el momento de inercia respecto al diámetro que pasa por los extre- 
mos del alambre es \ Ma 2 , siendo M la masa del alambre. 

12. Un alambre tiene la forma de un círculo x 2 + y 1 = a 1 . Determinar su masa y su mo- 
mento de inercia respecto a un diámetro si la densidad en (x, y) es ]x| + |y|. 

13. Hallar la masa de un alambre cuya forma es la de la curva de intersección de la esfera 
x 1 + y 2 + z 1 = lyel plano x + y + z = 0sila densidad del alambre en (x, y, z) es x 1 . 

14. Un alambre uniforme tiene la forma de la porción de curva de intersección de las dos 
superficies x 1 + y 1 = z 1 e f = x que une los puntos (0,0,0) y (1, 1, V2). Hallar la coor- 
denada z del centroide. 

15. Determinar las cûordenadas x e ŷ del centro de gravedad del muelle que se cita en el 
ejemplo 1 de la sección 10.8. 

16. Para el muelle del ejercicio 1 de la sección 10.8, calcular los momentos de inercia I, e 
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10.10 Conjuntos conexos abiertos. Independencia del camino 

Sea S un conjunto abierto de R". E1 conjunto S se llama conexo si todo par 
de puntos de S puede unirse mediante un camino regular a trozos cuya gráfica 
está situada en S. Esto es, para todo par de puntos a y b de S existe un camino 
regular a trozos ot defmido en un intervalo [fl, &] tal que <*(/) e S para cada 
t de [fl, b], siendo a(a) = a y a(b) = b. 

En la figura 10.3 se muestran tres ejemplos de conjuntos convexos abiertos. 
Ejemplos análogos a ésos en el espacio de tres dimensiones podrían ser a) un 
sólido elipsoidal, b) un sólido poliédrico, y c) un sólido tórico; en cada caso sólo 
se consideran los puntos interiores. 

Un conjunto abierto S se dice que es no conexo si S es la reunión de dos o 
más conjuntos abiertos no vacíos disjuntos. En la figura 10.4 se muestra un ejem- 
plo. Puede demostrarse que la clase de los conjuntos conexos abiertos es idéntica 
a la de los conjuntos abiertos que son no conexos. (*) 

Sea ahora / un campo vectorial continuo en un conjunto conexo abierto S. 
Elijamos dos puntos a y b de S y consideremos la integral de línea de / a lo largo 
de un camino regular a trozos situado en S que una a y b. E1 valor de la integral 
depende, en general, del camino que une a y b. Para ciertos campos vectoriales, la 
integral depende únicamente de los extremos a y b y no del camino que los 
une. En este caso decimos que la integral es independiente del camino que une 
a y b. Decimos que la integral de linea de / es independiente del camino en S si 
es independiente del camino que une a y b para todo par de puntos a y b de S. 



(a) (b) (c) 


Figura 10.3 Ejemplos de conjuntos conexos Figura 10.4 Conjunto no conexo S, 
abiertos. reunión de dos discos circulares 

disjuntos. 

cQué campos vectoriales tienen integrales de línea independientes del camino? 
Para contestar esta píegunta, extendemos los teoremas fundamentales primero y 
segundo del cálculo a las integrales de línea. 

(*) Para estudiar con mayor profundidad la conexión de conjuntos, véase el capítulo 8 
de la obra del autor Análisis Matemático, Editorial Reverté, Barcelona, 
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10.11 Segundo teorema fundamental del cálculo para integrales de línea 

E1 segundo teorema fundamental para funciones reales, como se dernostró en 
el volumen I (teorema 5.3), establece que 

.C <P'( 0 dt = <p(b) - <p(a), 


con tal que cp' sea continua en un cierto intervalo abierto que contenga a y b. 
Para extender ese resultado a las integrales de línea necesitamos una versión algo 
más fuerte del teorema en la que la continuidad de <p' se supone solamente en el 
intervalo abierto (a, b). 

teorema 10.2. Si <p es um función real continua en un intervalo cerrado 
[ a,b ], si suponemos que la integral j» <p'(t)dt existe y si <p' es conlinua en el 
intervalo abierto (a, b), entonces tenemos 


<p'(t) dt = <p(b) - <p(a). 


Demostración. Para cada x de [ a, b ] defmamos f(x) = fâ<p'(t) dt. Queremos 
demostrar que 

(10.2) f(b) = <p(b) — <p(a). 

Según el teorema 3.4 del volumen I, / es continua en el intervalo cerrado [a, b\. 
Según el teorema 5.1 del volumen I, / es derivable en el intervalo abierto (a, b), 
con f(x) = <f.'(x) para cada x de (a, b). Por consiguiente, según el teorema de la 
derivada nula (teorema 5.2 del volumen I), la diferencia f - <pe s constante en el 
intervalo abierto (a, b). Por la continuidad, / — <p también es constante en el in- 
tervalo cerrado \_a,b\. En particular, f(b)-<p(b) = f(a)-<p(a). Pero como 
f(a) = Q, esto demuestra (10.2). 

TEOREMA 10.3. SEGUNDO TEOREMA FUNDAMENTAL DEL CÁLCULO PARA INTE- 
grales de li'nea. Si <p es un campo escalar diferenciable con gradiente continuo 
V <p en un conjunto conexo abierto S en R\ entonces para dos puntos cualesquiera 
a y b unidos por un camino regular a trozos a situado en S tenemos 


Sa % ' da = <p(b) — <p(a). 

Demostración. Elíjamos dos puntos cualesquiera a y b de S y unámoslos con 
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un camino regular a trozos a situado en S defmido en un intervalo [a, b]. Supon- 
gamos primero que a es regular en [a, 6]. Entonces la integral de línca de Vç 
entre a y b a lo largo de a viene dada por 

J a V<p ■ da = jj Vç:[a(í)] ■ a'(í) dt. 

Según la regla de la cadena tenemos 

Vy[«(0] • «'(0 = g'(0, 

en donde g es la función compuesta definida en [ a, b ] por la fórmula 


g(t) = ç>[a(f)]. 

La derivada g' es continua en el intervalo abierto (a, b) debido a que Vç> es con- 
tinua en S y a es regular. Por lo tanto podemos aplicar el teorema 10.2 a g obte- 
niendo 

J a V(p- da = £ g'(t) dt = g(b) - g(a) = <p[a(b)] - <p[a(a )] = <p(b) - <p(a). 


Esto prueba el teorema si a es regular. 

Cuando a es regular a trozos efectuamos una partición del intervalo [a, b] 
en un número finito (por ejemplo r) de subintervalos [/*_,, í*], en cada uno de 
los cuales a es regular, y aplicamos el resultado que acabamos de demostrar a 
cada subintervalo. Esto nos dice 


J a V9 5 = 2 Vç> = 2{?>[a(4)] “ Ç>[a(íì-i)]} = <p(b) - <p(a), 

como queríamos demostrar. 

Como consecuencia del teorema 10.3 vemos que la integral de línea de un 
gradiente es independiente del camino en cualquier conjunto S conexo en el que 
el gradiente sea continuo. Para un camino cerrado tenemos b = a, así que 
<p(b) — <p(a) = O.Dicho de otro modo, la integral de línea de un gradiente con- 
tinuo es cero a lo largo de todo camino cerrado regular a trozos situado en S. 
En la sección 10.14 demostraremos (en el teorema 10.4) que los gradientes son 
los únicos campos vectoriales continuos con esta propiedad. 
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10.12 Aplicaciones a la Mecánica 

Si un campo vectorial / es el gradiente de un-campo escalar <p, entonces <f se 
llama función potencial para /. En el espacio de tres dimensiones, los conjuntos 
de nivel <p se llaman superficies equipotenciales; en dos dimensiones se llaman 
líneas equipotenciales. (Si <p representa la temperatura, la palabra «equipotencial» 
se reemplaza por «isoterma»; si <f representa la presión se emplea la palabra 
«isobara».) 

ejemplo 1. En el espacio tridimensional, pongamos <p(x, y, z) = r", sien- 
do r = ( x 2 + y 2 + z 2 ) V2 . Para todo entero n tenemos 

V(r") = nr”-*r, 

donde r = xi + yj + zk • (Véase el ejercicio 8 de la sección 8.14). Por lo tanto <p 
es un potencial del campo vectorial 

f(x,y, z) = nr n ~ 2 r. 

Las superficies equipotenciales de <p son esferas concéntricas con el centro en el 
origen. 

ejemplo 2. Potencial newtoniano. La ley de la gravitación de Newton 
establece que la fuerza / que ejerce una partícula de masa M sobre otra particula 
de masa m es un vector de longitud GmM/r 2 , en donde G es una constante y r es 
la distancia entre Ias dos partículas. Situemos el origen en la partícula de masa M, 
y sea r = xi + yj + zk el vector posición que une el origen a la partícula de 
masa m. Entonces r = j|r || y — rfr es un vector unitario con la misma dirección 
que /, con lo que la ley de Newton toma la forma 

/ = —GmMr- 3 r. 

Haciendo n =—len el ejemplo 1 vemos que la fuerza de gravitación / es el 
gradiente del campo escalar dado por 

<p(x,y, z) = GmMr- 1 . 

Éste es el potencial de Newton. 

E1 trabajo efectuado por la fuerza de gravitación al mover la partícula de 
masa m desde (x lt y lt zj a (x 2 , y 2 , z 2 ) es 


<p(x i, yi, zj) - <p(x 2 , y 2 , z 2 ) = GmM 
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en donde r, = (x 2 + y\ + z\)' A y r 2 = {x\ +y\ + z\Y A ■ Si los dos puntos están 
en la misma superficie equipotencial entonces = r 2 y no se realiza trabajo 
alguno. 

ejemplo 3. Principio de conservación de la energía mecánica. Sea / un 
campo de fuerzas continuo que tiene un potencial <p en un conjunto conexo abier- 
to S. E1 teorema 10.3 nos dice que el trabajo efectuado por / al mover una par- 
tícula desde a hasta x siguiendo un camino regular a trozos situado en S es 
<p(x) - <p{a) , la variación de la función potencial. En el ejemplo 2 de la sección 
10.6 se demostró que este trabajo es también igual a la variación de la energía 
cinética de la partícula, k{x) — k{a) en donde k{x) representa la energía cinetica 
de la partícula cuando está situada en x. Así pues, tenemos 

k{x) - k{a) = <p{x) - <p{a). 


o 

(10.3) k( - x ï ~ ?>(*) = k(a( ~ < K fl )- 

E1 escalar —<p{x) se denomina energía potencial ( * ) de la partícula. 

Si a se mantiene fijo yise hace variar en el conjunto S, la ecuación (10.3) 
nos dice que la suma de k(x) y - <p(x) es constante. Es decir, si un campo de 
fuerzas es un gradiente, la suma de las energias cinética y potencial de una par- 
tícula que se desplaza en dicho campo es constante. En Mecánica esto se llama 
principio de conservación de la energía (mecánica). Un campo de fuerzas con una 
función potencial se llama conservativo porque la energía total, cinética más po- 
tencial, se conserva. En un campo conservativo, no se realiza trabajo alguno al 
mover una partícula alrededor de una curva cerrada volviendo al punto de par- 
tida. Un campo de fuerzas no será conservativo si existe fricción o viscosidad en 
el sistema, puesto que ésas tienden a convertir energía mecánica en energía calo- 
rífica. 

10.13 Ejercicios 


1. Determinar cuáles de los siguientes conjuntos abiertos S de R 2 son conexos. Para cada 
conjunto conexo, elegir dos puntos distintos cualesquiera de S y explicar como se 
podría encontrar en S una curva regular a trozos que los uniera. 

a) S = {(x,/) | x 2 +y 2 > 0}. c) S = {(x,y) \ x 2 + y 2 < 1}. 

b) S = {(x,ỳ) | x 2 +y 2 >0}. d) S = {(x,y) | 1 <x 2 +y 2 <2}. 

é) S = {(x, y)\ x 2 + y 2 > l y (x-3) 2 +/>l). 

f) S = {(x, y) | x 2 + y 2 < 1 o (x - 3) 2 +/ < 1}. 


(*) Algunos autores consideran a — <p como la función potencial de / de modo que la 
energía potencial en x será igual al valor de la funcion potencial <p en x. 
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2. Dado un campo vectorial bidimensional 

f(x, y) = P(x, y)i + Q(x,y)j, 

en el que las derivadas parciales dP/dy y 3 Q/dx son continuas en un conjunto abierto 
S. Si / es el gradiente de un cierto potencial <p, demostrar que 

SP _ SQ 
Sy Sx 


en cada punto de S. 

3. En cada uno de los siguientes campos vectoriales, aplicar el resultado del ejercicio 2 
para demostrar que / no es un gradiente. Hallar seguidamente un camino cerrado C tal 
que j c f 0. 

a )f\x,y) = yi - xj. 
b )f(x,y) = yi + (xy - x)j. 

4. Dado un campo vectorial tridimensional 

f(x,y, z) = P(x,y, z)i + Q(x,y, z)j + R(x,y, z)k, 
en el que las derivadas parciales 

3P SP SQ SQ 3R SR 

8y Sz ' Sx Sz ’ Sx ’ 8y ’ 

son continuas en un conjunto abierto S. Si / es el gradiente de una cierta función po- 
tencial ç, demostrar que 

SP _SQ SP _ SR SQ _ SR 

3y 3x ’ 3z 3x ’ 3z 3y 


en cada punto de S. 

5. En cada uno de los siguientes campos vectoriales, aplicar el resultado del ejercicio 4 
para demostrar que / no es un gradiente. Hallar seguidamente un camino cerrado C 
tal que j c f * 0. 

a) f(x, y, z) = yi + xj + xk. 

b) f(x,y, z) = xyi + (x 2 + 1 )j + z 2 k. 

6. Un campo de fuerzas / está definido en el espacio de tres dimensiones por la ecuación 

f(x, y, z) = yi + zj + yzk. 

a) Determinar si / es o no conservativo. 

b) Calcular el trabajo realizado al mover una partícula a lo largo de la curva de 
ecuación 


a(t) = cos 1 1 + sen tj + e*k 

cuando t varía de 0 a tr. 
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7. Un campo de fuerzas bidimensional F tiene por ecuación 
F(x,y) = (x + y)ì + (x - y)j . 

a) Demostrar que el trabajo realizado por esa fuerza al mover una partícula siguiendo 
la curva 


«(0 =/(')*' +g(t)i, a <t <b, 
depende únicamente de f(a), f(b), g(a), g(b). 

b) Hallar el trabajo realizado cuando f(a) = 1, f(b) = 2, g(a) = 3, g(b) = 4. 

8. Un campo de fuerzas viene dado en coordenadas polares por la ecuación 

F(r,0) = -4 sen 0 i + 4 sen Oj. 

Calcular el trabajo efectuado al mover una partícula desde el punto (1,0) al origen si- 
guiendo la espiral cuya ecuación polar es r = e ». 

9. Un campo de fuerzas radial o «central» F en el plano puede expresarse en la forma 
F (x, y) = f(r)r en donde r = xi + yj y r = ][r||. Demostrar que un tal campo de fuer- 
zas es conservativo. 

10. Hallar el trabajo realizado por la fuerza F(x,y) = (3+ 2 + 2)i + \6xj al mover una par- 
tícula desde ( — 1,0) a (1,0) siguiendo la mitad superior de la elipse b 2 x 2 + y 2 = b 2 . 
iQué elipse (es decir, qué valor de b) hace mínimo el trabajo? 


10.14 E1 primer teorema fundamental del cálculo para integrales de línea 

En la sección 10.11 se extendió el segundo teorema fundamental del cálculo 
a las integrales de línea. En esta sección se extiende el primer teorema fundamen- 
tal. Recordemos que éste establece que toda integral indefinida de una función 
continua / tiene una derivada igual a /. Esto es, si 


tf(x) = j‘f(t) dt, 

en los puntos de continuidad de / tenemos 

*'<*) = /(*)• 


Para extender este teorema a las integrales de línea comenzamos con un cam- 
po vectorial / continuo en un conjunto conexo abierto S, y lo integramos a lo 
largo de una curva regular a trozos C entre un punto fijo a de S a un punto 
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cualquiera *. Designemos entonces con <f el campo escalar definido por la inte- 
gral de línea 

<f(x) = [*f- da, 

en donde a es la función que origina C. Puesto que S es conexo, cada punto x de 
S puede ser alcanzado por una tal curva. Para que esta definición de ç U)carezca 
de ambiguedad, necesitamos saber que la integral depende únicamente de x y 
no del camino utilizado para unir a con x. Por consiguiente, es natural exigir que 
la integral de línea de / sea independiente del camino en S. En esas condiciones 
la extensión del primer teorema fundamental toma la forma siguiente: 

TEOREMA 10.4. PRIMER TEOREMA FUNDAMENTAL PARA INTEGRALES DE 
línea. Sea f un campo vectorial continuo en un conjunto conexo abierto S de 
R". y supongamos que ìa integral de línea de f es independiente del camino en S. 
Sea a un punto fijo deSy definamos un campo escalar (f en S mediante la ecuación 

<f(x) = J 0 /• da, 

en donde a es un camino regular a trozos de S que une a con x. Existe entonces 
el gradiente de cp y es igual a f; es decir 

V<f(x) =/( x) para todo x de S. 

Demostración. Demostraremos que la derivada parcial D k <f(x ) existe y es 
igual a f k ( x), componente A:-ésima de f(x), para cada k = 1, 2,... ,n y cada 
x de S. 

Sea B(x; r) una n-esfera con centro en x y radio r contenida en S. Si y es 
un vector unitario, el punto x + hy también está contenido en S para todo h real 
que satisfaga la condición 0 < \h\ < r, y podemos formar el cociente de dife- 
rencias 

<p(x + hy) - <f(x) 
h 

En virtud de la propiedad aditiva de las inlegrales de línea, el numerador de ese 
cociente puede escribirse en la forma 

<p(x + hy) - <f( x ) = h +hy f- da, 

y el camino que une x con x + hy puede ser cualquier camino regular a trozos 
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contenido en S. En particular, podemos emplear el segmento de recta represen- 
tado por 


a(/) = x + thy , en donde 0 < t < 1. 

Puesto que a'(í) = hy el cociente de diferencias toma la forma 

(10.4) rtx + ly)-g W_ j' nx + thy) . rd ,. 

Tomemos ahora j; = e k , el fc-ésimo vector coordenado unidad, y observemos que 
el integrando se transforma en f(x + thy) ■ y = f k (x 4- the k ). Hagamos luego el 
cambio de variable u = ht, du = hdt, y escribamos (10.4) en la forma 

_ ì p + „ () . 

h h Jo h 

en donde g es la función definida en un intervalo abierto (— r, r) por la ecuación 


g(t) = f 0 Vit(JC + uef) du. 

Como cada componente /* es continua en S, el primer teorema fundamental para 
integrales ordinarias nos dice que existe g'(í) para cada t en (— r, r) y que 

g'(t) =f k (x + te k ). 

En particular, g'(O) = f k (x). Por consiguiente, si en (10.5) hacemos que h ■* 0, 
encontramos que 


lim 'Úl+JMM î l , Um _ g '(0) , Uxì ■ 

h -o h >i-o h 


Esto demuestra que la derivada parcial D k (f(x) existe y es igual af k (x), como que- 
ríamos demostrar. 

10.15 Condiciones necesarias y suficientes para que un campo vectorial sea un 
gradiente 

Los teoremas fundamentales primero y segundo para integrales de línea nos 
dicen que una condición necesaria y suficiente para que un campo vectorial sea 
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un gradiente en un conjunto conexo abierto es que su integral de línea entre dos 
puntos cualesquiera sea indepcndicntc del camino. Demostraremos ahora que esa 
condición equivale a afirmar que la integral de Iínea, a lo largo de cualquier 
camino cerrado regular a trozos, es nula. Todas esas condiciones están resumidas 
en cl siguiente teorema. 

TEORHMA 10.5. CONDICIONES NECESARIAS Y SUFICIENTES PARA QUE UN CAM- 
i’O vectorial sea un GRADiENTE. Si f es un campo vectorial continuo en un 
conjunto conexo abierto S de R", entonces son equivalentes las tres ajirmaciones 
siguientes: 

a) fes gradiente de una cierta función potencial en S. 

b) La integral de línea de f es independiente del camino en S. 

c) La integral de línea de f alrededor de todo camino cerrado regular a tro- 
zos contenido en S es nula. 

Demostración. Demostraremos que b) implica a), a) implica c), y c) im- 
plica b). La afirmación b) implica a) en virtud del primer teorema fundamental. 
EI segundo teorema fundamental pone de manifiesto que a) implica c). 

Para completar la demostración probemos que c) implica b). Supongamos 
que se cumple c) y sean C, y C» dos curvas regulares a trozos cualesquiera en S 
con los mismos extremos. Sea la curva C, la gráfica de una función a definida 
en un intervalo [a, b], y C 2 la gráfica una función /3 definida en [c, d]. 

Definamos una nueva función y del modo siguiente: 


Y (0 = 


M0 

1(5(6 + d-t) 


si a<t<b, 
si b<t<b + d-c. 


Entonces y describe una curva cerrada C tal que 

j c f' d Y = S c /' da - f c /' d P- 


Puesto que en virtud de c) § c f-dy = 0, tenemos J Ci /- da = J ' c f- d$, por lo 
que la integral de / es independiente del camino. Esto demuestra b). Así pues, 
a), b) y c) son equivalentes. 


Observación: Si j ( , / + 0 para una determinada curva cerrada C, entonces 
fno es un gradiente. No obstante, si una integral de línea \ c f es cero para una 
cierta curva cerrada C o incluso para infinitas curvas cerradàs, no se deduce nece- 
sariamente que f es un gradiente. Por ejemplo, el lector puede comprobar fácilmente 
que la integral de línea, del campo vectorial f(x,y) = xi + xyj es cero para todo 
círculo con centro en el origen. No obstante, este campo vectorial no es un gradiente. 
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10.16 Condiciones necesarias para que un campo vectorial sea un gradiente 

E1 primer teorema fundamental puede utilizarse para determinar si un campo 
vectorial dado es o no un gradiente en un conjunto conexo abierto S. Si la inte- 
gral de línea de / es independiente del camino en S, definimos sencillamente un 
campo escalar <f integrando / desde un punto fijo a un punto x cualquiera de S 
siguiendo un camino adecuado en S. Calculamos entonces las derivadas parcia- 
les de <p y comparamos D k <p con f k , k-é simo componente de / Si D k y(x) —J k (x) 
para todo x de S y todo k, entonces / es un gradiente en S y <( es un potencial. 
Si D k f((x) 9 ^ f k (x) para algún k y un cierto x, entonces / no es un gradiente en S. 

E1 teorema siguiente da otro criterio para determinar cuando un campo vec- 
torial / no es un gradiente. Este criterio es muy útil en la práctica porque no exige 
integración alguna. 

TEOREMA 10.6. CONDICIONES NECESARIAS PARA QUE UN CAMPO VECTORIAL 

sea un gradiente. Si f = (/i./„) es un campo vectorial diferenciable con 

continuidad en un conjunto abierto S de R\ y si f es un gradiente en S, entonces 
las derivadas parciales de los componentes de f están ligados por las ecuaciones 

(10.6) = DJi(x) 

para i, j = 1,2.ny todo x de S. 

Demostración. Si / es un gradiente, /= V<p para una cierta función po- 
tencial <p. Esto significa que 


fi = D ><P 

para cada j = 1, 2,.... n. Derivando ambos miembros de esta igualdad respecto 
a Xi encontramos 

Dtfj — DiDjff. 

Del mismo modo, tenemos 

Djf = DjDi<p. 

Puesto que las derivadas parciales Di/, y Djfi son continuas en S, las dos deriva- 
das parciales mixtas DiDj<py DjDi<p deben ser iguales en S. Esto demuestra (10.6). 

ejemplo 1. Determinar si el campo vectorial 

f(x,y) = 3 x 2 yi + x 3 yj 


es o no un gradiente en algún subconjunto abierto de R 2 . 



416 


Integrales de línea 


Solución. Tenemos aquí 

fi(x, y) = 3 x*y, f 2 (x, j) = x 3 y. 


Las derivadas parciales DJ y Df 2 vienen dadas por 

D 2 fi(x, y) = 3x 2 , DJ 2 (x, y) = 3x 2 j. 

Puesto que D 2 ffx, y) # D,f 2 (x, y) excepto cuando x = 0 o y = 1, este campo 
vectorial no es un gradiente en ningún subconjunto abierto de R 2 . 

E1 ejemplo que sigue pone de manifiesto que las condiciones del teorema 
10.6 no siempre son suficientes para que un campo vectorial sea un gradiente. 

ejemplo 2. Sea S el conjunto de todos los puntos (x, y) ¥= (0, 0) en R 2 , y 
sea/el campo vectorial definido en S por la ecuación 


f(x, y) = - r ^-i + 
x 2 + y 


Demostrar que Df 2 = D 2 f 2 en todo el conjunto S pero que, sin embargo, / no 
es un gradiente en S. 


Solución. Es fácil comprobar que Df 2 (x, y) = D 2 f i(x, y) para todo punto 
(x, y) de S. (Véase ejercicio 17 de la sección 10.18.) 

Para demostrar que/ no es un gradiente en S calculamos la integral de línea 
de / a lo largo de la circunferencia unidad dada por 


“(0 = cos ti + sen/y, 0 ^í<2tt-. 

Obtenemos 

jf- da. = /[o(í)j • «'(0 dt = J fl (sen 2 í + cos 2 1 ) dt = 2ir. 

Puesto que la integral de línea a lo largo de ese camino cerrado no es cero, / no 
es un gradiente en S. En el ejercicio 18 de la sección 10.18 se discuten otras pro- 
piedades de ese campo vectorial. 

A1 final de este capítulo demostraremos que las condiciones necesarias del 
teorema 10.6 son también suficientes si se cumplen en un conjunto convexo 
abierto. (Véase el teorema 10.9.) 
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10.17 Métodos especiales para construir funciones potenciales 

E1 primer teorema fundamental para las integrales de línea nos propor- 
ciona también un método para construir funciones potenciales. Si / es un gra- 
diente continuo en un conjunto conexo abierto S, la integral de línea de / es 
independiente del camino en S. Por lo tanto podemos encontrar un potencial en 
S. Por lo tanto podemos encontrar un potencial rp integrando / desde un punto 
fijo o hasta un punto cualquiera x de S, siguiendo un camino regular a trozos 
situado en S. E1 campo escalar que así se obtiene depende de la elección del punto 
inicial a. Si empezamos en otro punto inicial b, obtenemos un nuevo potencial ý. 
Pero, en virtud de la propiedad aditiva de las integrales de línea, cp y ỳ pueden 
diferir únicamente en una constante, siendo ésta la integral de / entre a y b. 

Los ejemplos que siguen ilustran el empleo de distintos caminos de inte- 
gración. 


(a. v) (x.y) 

!-ZZII-1 


( a, b) -" (.v. b) 


Figura 10.5 Dos caminos poligonales que unen ( a.b ) con (x,y). 

ejemplo 1. Construccìón de un potencial en un rectángulo abierto. Si / es 
un gradiente continuo en un rectángulo abierto de R", puede construirse un po- 
tencial integrando entre un punto fijo y un punto arbitrario siguiendo un camino 
formado por segmentos rectilíneos paralelos a los ejes coordenados. En la figura 
10.5, se representa un ejemplo en dos dimensiones. Podemos integrar primero 
desde (a, b) hasta (x, b) a lo largo de un segmento horizontal y luego desde (x, b) 
hasta (x, y) siguiendo un segmento vertical. A lo largo del segmento horizontal 
empleamos la representación paramétrica 


a(í) = ti + bj. 


a<t<x. 
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y a lo largo del vertical empleamos esta otra 

a (t)=xi+tj, b<t<:y. 

Si /(-v, j) = ffx, y)i + f 2 (x, y)j , la fórmula que resulta para un potencial 

<p(x, y ) es 

(10J) V (x ' J') = b) dt + íl Ux , t ) dt. 

Podríamos asimismo integrar primero desde (a, b) hasta (a, y) siguiendo un 
segmento vertical y luego desde ( a, y) hasta (x, y) a lo largo de un segmento ho- 
rizontal como se indica con rectas punteadas en la figura 10.5. Esto nos da otra 
fórmula para <p(x, y), 

( |0 - 8 ) <p(x, y) = /j/afa, t) dt + JjhO, y) dt. 

Ambas fórmulas (10.7) y (10.8) nos dan el mismo valor para <p(x, y) debido 
a que la integral de línea de un gradiente es independiente del camino. 

■ , EIE , MPL0 ,^' Construcción de una función potencial utilizando integrales 
mdefimdas. E1 uso de integrales indefinidas nos simplifican a menudo el cálculo 
de funciones potenciales. Por ejemplo, supongamos que un campo vectorial tri- 
dimensional / = (/ , / 2 , / 3 ) es el gradiente de una función potencial <p en un con- 
junto abierto S de R 3 . Tenemos entonces 

djP = f f , 

dx dy Jì ’ dz~ h 

en todo el conjunto S. Empleando integrales indefinidas e integrando la primera 
de esas ecuaciones respecto a x (manteniendo z e y constantes) encontramos 

<p(x, y,z) = J f t (x, y, z) dx + A(y, z), 

en donde A(y, z) es una «constante de integración» que hay que determinar. Aná- 
logamente, si integramos la ecuación d<p/dz =/ 3 respecto a y y a la ecuación 
d</ /dy =f 2 respecto a z obtenemos las relaciones 

<p(x, y,z) = J f 2 ( x , y , Z ) dy + B(x, z) 


<p(x, y, z) = J f 3 ( x , y, z) dz + C(x, y), 
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en las que B(x, z) y C(x, y) son funciones que tienen que determinarse. Encon- 
trar <p significa encontrar tres funciones A(y, z), B(x, z), y C(x, y) tales que las 
tres ecuaciones obtenidas para <p(x, y, z) tengan sus segundos miembros coinci- 
dente. En muchos casos eso puede conseguirse a simple vista, como el siguiente 
ejemplo muestra. 

ejemplo 3. Encontrar una función potencial <p para el campo vectorial 
definido en R' 1 por la ecuación 

f(x,y, z) = (2xyz + z 2 — 2y 2 + l)i + (x 2 z — 4xý)j + (x 2 y + 2xz - 2)k. 

Solución. Sin conocer de antemano si / tiene o no función potencial <p, in- 
tentamos construir un potencial como se indicó en el ejercicio 2, suponiendo que 
tal potencial <p exista. 

Integrando el componente /i respecto a x encontramos 


<p(x, y,z) = j (2xyz + z 2 - 2y 2 + 1 )dx + A(y, z) = x 2 yz + xz 2 

- 2 xy 2 + x + A(y, z). 

Integrando / s respecto a y, y luego f 3 respecto a z, encontramos 


9 ?(x, y,z) = J (x 2 z - 4 xy) dy + B(x, z) = x 2 yz - 2xy 2 + B(x, z), 

<p(x, y,z) = f (x 2 y + 2xz - 2) dz + C(x, y) = x 2 yz + xz 2 - 2z + C(x, y). 

fácilmente se ve que eligiendo +(y, z) = — 2z, B(x, z) = xz 2 + x — 2z y 
C(x, y) = x — 2xy 2 coinciden las tres ecuaciones; luego la función <p dada por la 
ecuación 


<p(x,y, z) = x 2 yz + xz 2 — 2 xy 2 + x — 2z 
es un potencial para / en R 3 . 

ejemplo 4. Construcción de un potencial en un conjunto convexo. Un 
conjunto S de R” se llama convexo si todo par de puntos de S puede unirse con 
un segmento rectilíneo, cuyos puntos pertenecen todos a S. En la figura 10.6 se 
representa un ejemplo. Todo conjunto convexo abierto es conexo. 

Si / es un gradiente en un conjunto convexo abierto, puede entonces cons- 
truirse un potencial <p integrando / entre un punto fijo a de S hasta un punto 
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cualquiera x siguiendo un segmento de recta que los una. Tal segmento puede 
representarse paramétricamente por la función 

“(0 = a + t(x — a) , en donde 0 < t < 1. 

Ésta nos da a'(t) = x - a, así que el potencial correspondiente viene dado por 
la integral 

(10.9) <f(x) = ///(« + t( x - a)) ■ (x - a ) dt. 



Convexo No convexo 

Figura 10.6 En un conjunto convexo S, el segmento que une a con b está contenido en S 
cualesquiera que sean a y b de S. 

Si S contiene el origen podemos considerar a = O y escribir (10.9) en la 
forma más sencilla 

(10.10) <p(x) = / o V(íx) ■ xdt. 

10.18 Ejercicios 


En cada uno de los ejercicios del 1 al 12, está definido un campo vectorial / por las 
formulas que se dan. En cada caso determinar si /es o no el gradiente de un campo escalar 
Cuando / sea un gradiente, hallar Ia correspondiente función potencial <p. 

1. f(x,y) = xi + yj. 

2. f(x,y) = 3 x 1 2 3 4 5 yi + x a j. 

3. f(x,y) = (2xe y + y)i + (x 2 e y + x — 2y)j. 

4. f(x, y) = (sen y -ysenx + x)i + (cos x + x cosy + y)j. 

5. f(x,y) = [sen(xrj) + xy cos (jcy)]í + ^cos (xy)j. 

6- f(x, y, z) = xi +yj + zk. 

1. f(x, y, z) = (x + z)i - (y + z)j + (x - ý)k. 
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8. f(x,y, z) = 2xfi + x 2 z 3 j + 3x 2 yz 2 k, 

9. f(x,y, z) = 3/z 2 i + 4x 2 z 2 j - 3x 2 y 2 k. 

10. f(x,y, z) = (2x 2 + 8 xy 2 )i + (3 x 3 y - 3xy)j - (4 y 2 z 2 + 2 x 2 z)k. 

11. f(x, y, z) = (y 2 cos x + z 3 )i — (4 — 2 y sen x)j + (3 xz 2 + 2 )k. 

12. f(x,y, z) = (4 xy - 3x 2 z 2 + l)i + 2(x 2 + 1 )j - (2x 3 z + 3z 2 )k. 

13. Un fluido se desplaza en el plano xy de mcdo que cada partícula se mueve en línea 
recta desde el origen. Si una partícula está a la distancia r del origen su velocidad es 
ar", en donde a y n son constantes. 

a) Determinar los valores de a y n para los cuales el campo vectorial velocidad es el 
gradiente de un cierto campo escalar. 

b) Encontrar una función potencial de la velocidad siempre que ésta sea un gra- 
diente. E1 caso n = — 1 debe tratarse separadamente. 

14. Si <p y ý son funciones potenciales para un campo vectorial continuo / en un conjunto 
conexo abierto S de R\ demostrar que <p — <p es constante en S. 

15. Sea S el conjunto de todos los puntos x ^ O de R". Pongamos r = ||x|| y sea f el campo 
vectorial definido en S por la ecuación 

f(x)=r»x, 

siendo p una constante real. Hallar una función potencial para / en S. E1 caso p = — 2 
debe tratarse separadamente. 

16. Resolver el ejercicio 15 para el campo vectorial definido por la ecuación 



siendo g una función real con derivada continua en todo R 1 . 

Los ejercicios que siguen se refieren al campo vectorial / definido en el conjunto S de 
todos los puntos (x, y) + (0,0) en R 2 por la ecuación 

f(x,y) = - i + x2 +yì J ■ 

En el ejemplo 2 de la sección 10.6 se demostró que / no es un gradiente en S, aunque 
D,fi = D 2 f i en todo S. 


17. Comprobar que para todo punto (x,y) de S tenemos 


DJ 2 (x,y) = D^fi^x, y) = 


f-x 2 
(x 2 +fr 


18. Este ejercicio muestra que / es un gradiente en el conjunto 


T =R 2 - {(jc, jp) | JP =0, x^0}. 
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quc c°n sta de todos los puntos del plano xy excepto los del eje x no positivo 
a) Si (x,y)e T, expresar teyen coordenadas polares 


x=rcos6, _y=rsenO, 

en donde r>0y ~ir < fi < tt. Demostrar que 6 viene dada por las fórmulas 


e = 



si x > 0, 
si * = 0, 
si x < 0. 


[Recuérdese la deftnición de la función arco tangente: Para cualquier valor real t, 
arc tan t es el número real único que satisface las dos condiciones tan <p = t y 
-ir/2 < <p < tt/ 2.] 
b) Deducir que 


36 y 36 x 

dx x 2 + y 2 ' dy x 2 + y 2 

para todo (x, y) en T . Esto demuestra que 8 es una función potencial para f en el 
conjunto T. 

Este ejercicio hace ver que la existencia de una función potencial depende no sólo 
del campo vectorial / sino también del conjunto en el que está defmido el campo 


10.19 Aplicaciones a Ias ecuaciones diferenciales exactas de primer orden 

Algunas ecuaciones diferenciales de primer orden pueden resolverse por me- 
dio de funciones potencial. Supongamos que tenemos una ecuación diferencial 
de la forma 


/ =f(x,y). 

Si multiplicamos ambos miembros por un factor no nulo Q(x, y) transformamos 
esta ecuación en otra de la forma Q(x, y )/ - f(x, y)Q(x,y) = 0. Si ponemos 
P(x, y) en lugar de - f(x,y)Q(x, y) y empleamos la notación de Leibnitz para las 
derivadas, escribiendo / en la forma dy/dx, la ecuación diferencial adopta la 
forma 


( 10 . 11 ) 


P(x,y) dx + Q(x,y) dy = 0 . 
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Supongamos que P y O son continuas en un cierto conjunto abierto conexo S del 
plano. A una tal ecuación diferencial podemos asociar un campo vectorial V, donde 

V(x,y)=P(x,y)i+Q(x,y)j. 

Los componentes P y Q son los coeficientes de dx y dy en la ecuación (10.11). 
Se dice que la ecuación (10.11) es exacta en S si el campo vectorial V es el gra- 
diente de un potencial; esto es, si V(x,y) = Vç>(jc,_y) para cada punto (x, y) de S; 
siendo cp un cierto campo escalar. Cuando un tal cp existe tenemos dcpfdx = P y 
d<p/dy = Q, y la ecuación diferencial (10.11) se transforma en 


S -îdx + d -2dy- 
dx By ' 


Demostraremos ahora que cada solución de esta ecuación diferencial satisface la 
relación <p(x, y) = C, siendo C una constante. Precisando más, supongamos que 
existe una solución Y de la ecuación diferencial (10.11) definida en un intervalo 
abierto (a, b) tal que el punto (x, 7(x)) está en S para cada x de (a, b). Demos- 
traremos que 


<p(x, Y(x)] = C 

para una cierta constante C. A tal fin introducimos la función compuesta g defi- 
nida en («, b) por la ecuación 


g(*) = <p(x, y(x)]. 

Según la regla de la cadena, la derivada de g viene dada por 

(10.12) g'(x) = D lt p[x, r(x)] + D 2 <p[x, fW]f'W = P(x,ý) + Q(x,y)y' , 

donde y = Y(x) e/ = Y'(x). Si y satisface (10.11), P(x, y) + Q(x, y)y' = 0, de 
modo que g'(x) = 0 para cada x en (a, b) y, por consiguiente, g es constante en 
(a, b). Esto prueba que toda solución y satisface la ecuación <p(x, y) = C. 

Podemos ahora invertir el razonamiento para hallar una solución de la ecua- 
ción diferencial. Sea la ecuación 

(10.13) <p(x, y) = C 

consideremos y como función diferenciable de x, tal como y = Y(x) para valores de 
x de un intervalo (a, b), y sea g(x)=<p[x, Y(x)]. La ecuación (10.13) implica que g 
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es constante en( flj è).Luego, según( 10.12), P(x, y) + Q(x, y)y’ = 0,de modo que 
y es ttna solución. Por consiguiente, hemos demostrado el teorema siguiente: 

teorema 10.7. Supongamos que la ecuación diferencial 


(10.14) P(x, ỳ) dx + Q(x, y)dy = 0 

es exacta en un conjunto conexo abierto S, y sea <p un campo escalar que satisface 


d<p 

dx 


P 


y 


d<p 

dy 


Q 


en todo S. Entonces toda solución y = Y(x) de (10.14) cuya gráfica está situa- 
da en S satisface la ecuación rp(x, 7(x)] = C para un cierto valor de C. Recípro- 
camente, si la ecuación 


<p(x,y) = C 

define y como función implícita diferenciable de x, entonces esta función es una 
solucìón de la ecuación diferencial (10.14). 

E1 teorema precedente nos proporciona un método rápido para resolver ecua- 
ciones diferenciales exactas de primer orden. Construimos una función poten- 
cial <p y escribimos la ecuación <p(x, y) = C, siendo C una constante. Siempre 
que esta ecuación defina y como función implícita de x, la correspondiente y 
satisface (10.14). Por tanto, podemos considerar la ecuación (10.13) como la 
representación de una familia de curvas integrales simplemente infinita, o sea, 
dependiente de un solo parámetro. Naturalmente, que los únicos valores admi- 
sibles de C son aquellos para los que <p(x 0 , y 0 ) = C para algún (x 0 , y 0 ) de S. 

ejemplo 1 . Consideremos la ecuación diferencial 


dy _ 3x 2 + 6xy 2 

dx 6 x 2 y + 4y 3 

Quitando denominadores se obtiene: 

(3x 2 + 6 xy 2 ) dx + (6x 2 y + 4y 3 ) dy = 0. 

Este es ahora un caso particular de (10.14) siendo P(x, y) = 3x 2 + 6xy 2 y 
Q(x, y) = 6x 2 y + 4/ . Integrando P con respecto a x y Q con respecto a y y 
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comparando los resultados, encontramos que una función potencial <p viene dada 
por la fórmula 


<p{x,y) = x 3 + 3x 2 / +/. 

Según el teorema 10.7, cada solución diferencial satisface 
jc 3 + 3 x 2 y 2 + y* = C 

para un cierto C. Esto representa en forma implícita una familia de curvas inte- 
grales. En este caso particular la ecuación es cuadrática en y 2 y puede despejarse 
y en función de x y de C. 

ejemplo 2. Sea Ia ecuación diferencial de primer orden 

(10.15) . ydx + 2xdy = 0. 

En este ejemplo P(x, y) = y y Q(x, y) = 2x. Puesto que dP/dy = 1 y dQ/dx = 2, 
esta ecuación diferencial no es exacta. Sin embargo, si multiplicamos ambos miem- 
bros por y obtenemos una ecuación que es exacta: 

(10.16) ý*dx + 2xydy = 0. 

Un potencial del campo vectorial y 2 i + 2xyj es <f(x, y) = xy 2 , y toda solución 
de (10.16) satisface la relación xy 2 = C. Esta relación también representa una 
familia de curvas integrales de la ecuación (10.15). 

E1 multiplicador y que ha convertido (10.15) en una ecuación exacta se 
llama factor integrante. En general, si al multiplicar una ecuación lineal de primer 
orden por un factor no nulo /x(x, y) se obtiene una ecuación diferencial exacta, 
el multiplicador fi(x,y) se denomina factor integrante de la ecuación origi- 
nal. Una ecuación diferencial puede tener más de un factor integrante. Por 
ejemplo, /i(x, y) — 2xy 3 es otro factor integrante de (10.15). En los ejercicios que 
siguen se discuten algunos casos particulares de ecuaciones diferenciales para las 
que se pueden encontrar fácilmente factores integrantes. 

10.20 Ejercicios 

Demostrar que las ecuaciones diferenciales de los ejercicios del 1 al 5 son exactas, y en 
cada caso hallar una familia simplemente infinita de curvas mtegrales. 

1. (x + 2y) dx + (2x + y) dy = 0. 

2. 2xy dx + x 2 dy = 0. 

3. (x 2 — y)dx - (x + sen 2 y) dy = 0. 
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4. 4sen .v sen 3r cos ,v dx - 3 cos 3 v cos 2.v dy = 0. 

5. (3-v-i- + 8.yr -)í/.v + (.v :t + 8a‘ 2 )' + 12 ye")dy = 0. 

6. Demostrar que una ecuación lineal de primer orden y' + P(x)y = Q(x), posee el factor 

integrante /i(.v) Resolver con él la ecuación. 

7. Sea ii(x,y) un factor integrante de la ecuación diferencial P(x,y)dx + Q(x,y)dy = 0. 
Demostrar que 

dP dQ d d 

T,-T x ■ 0 'S I °S | '' 1 ~ F Ty'°zW- 

Deducir de esta ecuación las siguientes reglas para encontrar factores integrantes: 

a) Si (dPj dy — SQ/dx)IQ es un función f(x) de la sola variable x, e S/<x)<i* es un 
factor integrante. 

b) Si (dQ/dx — dp/dy)/P es una función g(y) de la sola variable y, e la<y)<iy es un 
factor integrante. 

8. Como aplicación del ejercicio 7 hallar factores integrantes, y hallar las familias de 
curvas integrales para las ecuaciones siguientes: 

a) ydx - (2.v + y)dy = 0. 

b) (.v 3 + y 3 ) dx - xy 2 dy = 0. 

9. Si dp/dy - dQ/dx = f(x)Q(x, y) -g(y)P(x, >’),demostrar que {) f(x) dx + J g(y) dy) 
es un factor integrante de la ecuación diferencial P(x,y)dx + Q(x,y)dy = 0. Hallar el 
correspondiente faclor integrante para cada una de las ecuaciones siguientes y su fami- 
lia simplemente infinita de curvas integrales: 

a) (2,v 2 _>' + y 2 ) dx + (2x 3 — xy) dy = 0. 

b) (e x sec y - >.an y) dx + dy = 0. 

10. Las siguientes ecuaciones diferenciales tienen un factor integrante común. Hallarlo y 
determinar la familia de’ curvas integrales para cada ecuación. 

(3 y + 4 xy 2 ) dx + (4x + 5 x 2 y) dy = 0, 

(6 y + x 2 y 2 ) dx + (8x + x 3 y) dy = 0. 


10.21 Funciones de potencial en conjuntos convexos 

En el teorema 10.6 se demostró que las condiciones 


= DJAx) 

son necesarias para que un campo vectorial diferenciable con continuidad 
/= í/i,...,/») sea un gradiente en un conjunto S de R". Se demostró luego, 
con un ejemplo, que esas condiciones no eran siempre suficientes. Demostramos 
en esta sección que las condiciones son suficientes siempre que S sea convexo. 
La demostración hará uso del siguiente tecrema relativo a la derivación bajo el 
signo integral. 
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teorema 10.8. Sea S un intervalo cerrado en R" con interior no vacîo y 
sea J = [a, 6] un intervalo cerrado en R'. Sea /„+, el intervalo cerrado S X / 
de R"''. Cada punto de J n+1 lo representamos por (x, t), en donde x e S y t eJ, 

(x, t) = ( Xl ,... , x n ,.t). 

Supongamos que <p es un campo escalar definido en J n+1 tal que la derivada par- 
cial Dkp sea continua en /„+,, siendo k unc de los números 1,2,...,«. Defina- 
mos un campo escalar <p en S por la ecuación 

<p(x) = jj xp(x, 0 dt. 

Existe entonces la derivada parcial Dk<p en cada punto interior de S y se obtiene 
con la fórmula 


Es decir, tenemos 


D k q(x) = jj D k y>(x, t) dt. 


° k jj V>(x, t) dt = jj D k xp(x, t) dt. 


Observación. Este teorema nos indica que podemos derivar bajo el signo integral. 

Demostración. Elijamos un x cualquiera en el interior de S. Puesto que 
int S es abierto, existe un r > 0 tal que x + he k e int S para todo h que satisfaga 
0 < h < r E1 vector e k es el A:-ésimo vector coordenado unidad de R". Para 
tal h tenemos 


(10.17) <p(x 4- he k ) — <p(x) = jj {<p(x + he k , t) — xp(x, t)} dt. 


Aplicando el teorema del valor medio al integrando tenemos 
xp(x 4- he k , t) — xp(x, t) = h D k xp(z, t), 

en donde z pertenece al segmento rectilíneo que une x con x + he k . Luego (10.17) 
se transforma en 
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Por consiguiente 

ÎÍ1 + *f» ) - _ J „ d , _ ,) - D M *. 0} d,. 

La última integral tiene un valor absoluto que no excede 

/ a * \ D k'P(z, t ) - D kV )(x, 01 dt < (b - a) max \D k y(z, t) - D k rp(x, r)| 

en donde el máximo es alcanzado para todo z del segmento que une x con 
x + he k , y todo t de [a, 6]. Teniendo en cuenta la continuidad uniforme de Dk 
en S X / (teorema 9.10) llegamos a la conclusión de que para todo c > 0 existe 
un S > 0 tal que ese máximo es < e/(b — a), siempre que 0 < \h\ < 8. Por lo 
tanto 

j ^ X — J D k y>(x, t) dt | < e siempre que 0 < |/t| < ó . 

Esto demuestra que D k cp(x) existe y es igual a Dkỳ(x, t) dt, como queríamos 
demostrar. 

Utilizaremos ahora este teorema para dar la siguiente condición necesaria 
y suHciente para que un campo vectorial sea un gradiente en un conjunto con- 
vexo. 

teorema 10.9. Sea / = (f lt ...,/„) un campo vectorial diferenciable con 
continuidad en un conjunto convexo abierto S de R". El campo f es un gradiente 
en S si y sólo si 

(10.18) D k f(x) = DJ k (x) 

para cada x de S y todos los índices k, j = 1,2,...,«. 

Demostración. Sabemos, por el teorema 10.6, que las condiciones son ne- 
cesarias. Para demostrar la suficiencia, supongamos (10.18) y construyamos un 
potencial q> en S. 

Supongamos, para simplificar, que S contenga el origen. Sea q (x) la integral 
de / a lo largo del segmento de recta que une O con un punto cualquiera x 
de S. Como antes se ha visto en la ecuación (10.10) tenemos 

<P(x) = / 0 V(íj:) • x dt = £ y>(x, t) dt, 
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en donde y(x, t) = f(tx) ■ x. Existe un subintervalo cerradon-dimensional Tde S 
con interior no vacío tal que ^ satisface las hipótesis del teorema 10.8 en T X /, 
siendo / = [0,1]. Por consiguiente la derivada parcial D k <f(x) existe para cada 
valor k = 1,2,...,« y puede calcularse derivando bajo el signo integral, 

D k<fU) = £ D k y(x, t ) dt. 

Para calcular D k y(x, t), derivamos el producto escalar f(tx) ■ x y obtenemos 

D k y(x, t) =f(tx) ■ D k x + D k {f(tx )} • x 

= f(tx) ■ e k + t(D k fx(tx), ..., D k f n (tx)) • x 
= f k (tx) + t(DJ k (tx),..., D n f k (tx)) x, 

habiendo utilizado en el último paso la relación (10.18). Tenemos por lo tanto 
D k y>(x, t) =f k (tx) + tVf k (tx) • x. 

Pongamos ahora g(t) = f k (tx) . Según la regla de la cadena tenemos 
g'(t) = Vf k (tx) ■ x 

así que la última fórmula que da D k y>(x, t) toma la forma 
D kf(x> 0=g(0 + tg’(t). 

Integrándola entre 0 y 1 encontramos 

(10.19) D k <f(x) = £ D k y>(x, t) = J q ‘ g(t) dt + JJ tg’(t) dt. 

Integremos por partes la última integral y obtenemos 

Jo *g '(0 dt = tg(0 | 0 - J 0 g(0 dt = g(l) - JJ g(t) dt. 

Por consiguiente (10.19) toma la forma 

D k ç(x)=g(l)=f k (x). 


Esto demuestra que V<p = f en S, lo cual completa la demostración. 
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11.1 Introducción 

En el volumen I se estudiaron las integrales f(x) dx, primero para fun- 
ciones defìnidas y acotadas en intervalos fìnitos, y luego para funciones no aco- 
tadas e intervalos infmitos. En el capítulo 10 del volumen II se ha generalizado 
el concepto de integral introduciendo las integrales de línea. Este capítulo extien- 
de el concepto en otra dirección. E1 intervalo unidimensional \_a, ò] se reemplaza 
por un conjunto Q bi-dimensional, llamado región de integración. Consideremos 
primero regiones rectangulares; luego consideraremos regiones más generales con 
contornos curvilíneos. E1 integrando es un campo escalar / definido y acotado en 
Q. La integral que resulta se llama integral doble y se representa mediante los 
símbolos 


JJ/. o j j f(x, y) dx dy. 

Q Q 

Como en el caso uni-dimensional, los símbolos dx y dy no desempenan 
ningún papel en la definición de la integral doble; no obstante, son útiles en el 
cálculo y transformación de integrales. 

E1 programa de este capítulo consta de varias partes. Discutimos primero 
la definición de integral doble. La introducción es análoga al caso uni-dimensional 
tratado en el volumen I. Se define la integral primero para funciones escalonadas 
y luego para funciones más generales. Como allí, la definición no proporciona 
un método para el cálculo efectivo de las integrales. Veremos que gran número 
de integrales dobles que se presentan en la práctica pueden calcularse por inte- 
gración unidimensional reiterada. Encontraremos también una conexión entre 
las integrales dobles y las de línea. Asimismo se dan aplicaciones de las integrales 
dobles a problemas de áreas, volúmenes, masas, centros de gravedad y conceptos 
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relacionados con aquéllos. Por último indicamos el modo de extender los con- 
ceptos al espacio de n dimensiones. 

11.2 Particiones de rectángulos. Funciones escalonadas 

Sea Q un rectángulo, producto cartesiano de dos intervalos cerrados [a, b~\ 
y íc.dì, 

Q = [a, b] X [c, d] = {(x, 7 )|xe [a, b] e y<=[c,d]}. 


,{_> !"./>] X [c,d\ 




Figura 11.1 Rectángulo Q producto Figura 11.2 Partición de un rectúngulo Q. 
cartesiano de dos intervalos. 


La figura 11.1 muestra un ejemplo. Consideremos dos particiones P^ y P 2 de 
[a, b] y [c,d], respectivamente. 


P, = x n _ x ,x„} y P 2 = {y 0 ,yi,... ,y m ~i,y m }, 

donde x„ = a, x,, = b, y„ = c, y m = d. Se dice que el producto cartesiano P, X P 2 
es una partición de Q. Puesto que P, descompone [a, b ] en n subintervalos y P 2 
descompone [c, d] en m subintervalos, la partición P = PiXP, descompone Q en 
mn subrectángulos. La figura 11.2 muestra un ejemplo de partición de Q en 30 sub- 
rectángulos. Una partición P' de Q se llama más fina que P si P S P', esto es, si 
todo punto de P pertenece también a P'. 

E1 producto cartesiano de dos subintervalos abiertos de P, y P 2 es un sub- 
rectángulo abierto (sin lados). Se llama subrectángulo abierto de P o de Q. 






Integral doble de una función escalonada 


433 


definición de función escalonada. Una función f definida en un rec- 
tángulo Q se llama escalonada si existe una partición P de Q tal que f es constante 
en cada uno de los subrectángulos abiertos de P. 

En la figura 11.3 se muestra un ejemplo de una tal función escalonada. Una 
función escalonada también posee valores precisos en cada uno de los puntos 



Figura 11.3 Gráfica de una función escalonada definida en un rectángulo Q. 

de los contornos de los subrectángulos, pero los valores en esos puntos no tienen 
importancia en la teoría de la integración. 

Si / y g son dos funciones escalonadas definidas en un rectángulo dado Q, 
la combinación lineal cj + c 2 g también es una función escalonada. En efecto, 
si P y P son particiones de Q tales que / es constante en los subrectángulos 
abiertos de P y g es constante en los subrectángulos abiertos de P’, entonces 
C\f + c 2 g es constante en los subrectángulos de la reunión P u P' (que podemos 
llamar afinamiento de P y P'). Así pues, el conjunto de funciones escalonadas 
definidas en Q forma un espacio lineal. 

11.3 Integral doble de una función escalonada 

Sean P = P^ X P 2 una partición del rectángulo Q en mn subrectángulos y 
/ una función escalonada, esto es, constante en los subrectángulos abiertos de Q. 
Designemos por Q„ el subrectángulo determinado por [*í_ lt xj e [y ; -i, y{] y sea 
cn el valor constante que toma / en los puntos interiores de Q, ; . Si / es positiva, el 
volumen de la caja rectangular con base Q, ; - y altura C; ; - es el producto 


Cij ■ (*< - - Jí-j) . 
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para toda función escalonada /, positiva o no, la suma de todos esos productos se 
toma como definición de integral doble de / sobre Q. Así pues, tenemos la si- 
guiente definición. 

DEFINICIÓN DE LA INTEGRAL DOBLE DE UNA FUNCIÓN ESCALONADA. Sea f 
una función escalonada que toma el valor conslante c i; - en el subrectángulo abierto 
(Xi- U x,) X (y/-i,y ; ) de un rectángulo Q. La integral doble de f en Q está defi 
nida por la fórmula 

(11.1) JJ / = ì î c„ • (*, - x.-^Xy, - yj _i). 

Q i=1 

Como en el caso unidimensional, el valor de la integral no varía si la parti- 
ción P se sustituye por otra partición más fina P'. Así, pues, dicho valor es inde- 
pendiente de la elección de P con tal que / sea constante en los subrectángulos 
abiertos de Q. 

Por brevedad, escribimos algunas veces Axí en lugar de (x, — Xí-J y Ay, en 
lugar de (y, — y,-_,), y la suma (11.1) se convierte en 

£ 2 c./A^Ay,. 

Para recordar cómo se forma esta suma, podemos escribir la integral en la forma 
JJ/(x, y) dx dy. 

Q 

Este símbolo no es más que otra notación para JJ/. 

Q 

Obsérvese que si / es constante en el interior de Q, es decir f(x, y) = k si 
a < x < b y c < y < d, tenemos 

(11.2) J \ f= k(b - a)(d - c), 

Q 

prescindiendo de los valores de / sobre los lados de Q. Puesto que 

b ~ a = JJ dx y d - c = j* dy, 

la fórmula (11.2) puede también escribirse así 


J J f = Sc [JJ/( X ’ y) dx\ dy = f" [/>, y) dy 1 dx. 

Q 


(11.3) 
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Las integrales que aparecen en el segundo miembro son unidimensionales, y se 
dice que la fórmula proporciona el valor de la integral doble por integración re- 
petida o por integraciones sucesivas. En particular, si aplicamos esta fórmula 
cuando / es una función escalonada del tipo antes descrito, podemos escribir: 

/ j /= J ", [ /* /(*> y> dx ] dy = í Z-i [ J’L /(x ’ y) dy ] dx - 

Qa 

Sumando respecto a i y / y usando (11.1), encontramos que (11.3) es válida’para 
funciones escalonadas. 

Las otras propiedades que siguen de la integral doble de una función esca- 
lonada son generalizaciones de los correspondientes teoremas unidimensionales. 
Pueden demostrarse como consecuencias inmediatas de la defmición (11.1) o 
mediante la fórmula (11.3) y los teoremas correspondientes para las integrales 
unidimensionales. En los teoremas siguientes los símbolos s y t representan fun- 
ciones escalonadas definidas en un rectángulo Q. Para eludir casos particulares 
triviales suponemos que Q es un rectángulo no degenerado; en otras palabras, 
que Q no es tan sólo un punto o un segmento rectilíneo. 

teorema 11.1. linealidad. Cualesquiera que sean los números reales 
Cj y c 2 tenemos 


/J [cis(x, y) + Cgt(x, J»)] dxdy = c^ff s(x, y) dx dy + c 2 f f t(x, y) dx dy. 
q Q Q 

teorema 11.2. aditividad. Si Q está subdividido en dos rectángulos 

Qi y Q„ 

J J s(x, y)dxdy = ff s(x, y) dx dy + f f s(x, y) dx dy. 

Q Qi Qi 

teorema 11.3. teorema de comparación. Si s(x, y) < t(x, y) para todo 
(x, y) de Q, entonces 

// s(x, y)dxdy< // í(x, y) dx dy. 

Q Q 

En particular, si t(x, y) > 0 para todo (x, y) de Q, entonces 
// t(x,y)dxdy > 0. 
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Dejamos como ejercicios las demostraciones de esos teoremas. 

11.4 Defìnición de integral doble de una función definida y acotada en un 
rectángulo 

Sea / una función defìnida y acotada en un rectángulo Q; en particular, su- 
pongamos que 


I f(x, v)l < M si (x,y)eQ. 

Entonces la función / puede quedar limitada por encima y por debajo por dos 
funciones escalonadas constantes s y t, siendo s(x, y) = — M y t(x, y) = M pars 
todo (x, y) en Q. Consideremos ahora dos funciones escalonadas cualesquierc 
s y t, defmidas en Q, tales que 

(11.4) s(x, y) <f(x, y) <, t(x, y) para todo punto (x, y) de Q. 

DEFINICIÓN DE LA INTEGRAL DE UNA FUNCIÓN ACOTADA EN UN RECTÁNGULO. 

Si existe un número I y solamente uno tal que 

(11.5) 

Q Q 

para todo par de funciones escalonadas que satisfagan las desigualdades (11.4), 
dicho número I se llama integral doble de f extendida a Q y se representa por el 
símbolo 


ílf O ///(,, y) dx dy. 

Q ç 

Cuando existe tal número I se dice que la función f es integrable en Q. 

11.5 Integrales dobles superior e inferior 

La defìnición de integral doble es completamente análoga al caso uni-di- 
mensional. 

Supongamos que / es acotada en un rectángulo Q y sean s y t dos funciones 
escalonadas que satisfacen (11.4). Decimos que s está por debajo de f, y t está 
por encima de f, y escribimos s < / C í. Designemos con S el conjunto de todos 

los números JJ s obtenidos al tomar como s todas v cada una de las funciones 
Q 
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escalonádas por debajo de f, y sea T el conjunto de todos los números JJ t obte- 

Q 

nidos al tomar como s todas y cada una de las funciones escalonadas por encima 
de f. Ambos conjuntos S y T son no vacíos puesto que / es.acotada. Asimismo, 

JJ í < JJ t si s < / < t, así que todo número de S es menor que todo número 
Q Q 

de T. Por consiguiente S tiene un extremo superior, y T tiene un extremo infe- 
rior, que satisfacen las desigualdades 

J/s^supS^infT^ JJí 

Q Q 

para toda s y toda t que satisfagan s < / < t. Esto prueba que los dos números 
supS e infT satisfacen (11.5). Por lo tanto, / es integrable en Q si y sólo si 
sup S = inf T, en cuyo caso tenemos 

IU = sup S = inf T. 

Q 

E1 número sup S se llama integral inferior de / y se representa por /(/). 
E1 número inf T es la integral superior de / y se representa por /(/). Así pues, te- 
nemos 


/(/) = sup J// * | s ^/J, /(/) = inf // t\f<, íj . 


E1 razonamiento anterior demuestra el siguiente teorema. 

teorema 11.4. Si una función f acotada en un rectángulo Q tiene una 
integral inferior I(f) y una integral superior /(/) que satisfacen las desigualdades 

// s < /(/) < /(/) < // t 

Q Q 

para todas las funciones escalonadas s y t que cumplen s < / < t, la función f 
es integrable en Q si y sólo si sus integrales superior e inferior son iguales, en 
cuyo caso tenemos 


JJ/=/(/) = /(/)• 
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Puesto que las defìniciones anteriores son del todo análogas a las del caso 
uni-dimensional, no debe sorprender que las propiedades de linealidad y aditi- 
vidad y el teorema de comparación establecidos para funciones escalonadas en la 
sección 11.3, sean válidas también para las integrales dobles en general. Las 
demostraciones de esas propiedades son análogas a las del caso uni-dimensional 
y las omitiremos. 

11.6 Cálculo de una integral doble por integración uni-dimensional reiterada 

En la teoría de la integración unidimensional, el segundo teorema funda- 
mental del cálculo proporciona un método para calcular integrales sin exigir la 
definición de integral en cada caso. E1 teorema siguiente logra el mismo resultado 
en dos dimensiones, y nos. permite calcular ciertas integrales dobles mediante 
dos integraciones unidimensionales sucésivas. E1 resultado es una extensión de la 
fórmula (11.3), que ya hemos demostrado para funciones escalonadas. 

teorema 11.5. Sea f una función definida y acotada en un rectángulo 
0 = [a, b] X [c,d], y supongamos que f es integrable en Q. Supongamos que 
para cada y fija en [c, d] la integral uni-dimensional f(x, y) dx exista, y desig- 
nemos su valor por >4(y). Si existe la integral f d c /l(y), ês igual a la integral doble 
/J/. Es decir, tenemos la fórmula 
Q ( 

(! 1 - 6 ) J/ /(*, y) dx dy = J ' [jj(x , y) dxì dy. 

Q 

Demostración. Elijamos dos funciones escalonadas. cualesquiera s y t que 
satisfagan s < / < t en Q. Integrando con respecto a x en el intervalo°[a, 6] 
tenemos 


/J y) dx < A(y) < jj t(x, y) dx. 

Puesto que la integral f d /l(y) dy existe, podemos integrar esas dos desigualdades 
c°n respecto ayen [c, d] y aplicar la ecuación (11.3) obteniendo 

jj s<j a A(y)dy<jj t. 

Q Q 

Por consiguiente $ d c A(y) dy es un número comprendido entre // s e // t para 

todas las funciones s y t que aproximan / por debajo y por enclma, respectiva- 
mente. Puesto que / es integrable en Q, el único número con esa propiedad es la 
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integral doble de / en Q. Por tanto j d /l(y) dy = JJ - /, lo que demuestra la ecua- 
ción (11.6). Q 

Se dice que la fórmula (11.6) proporciona una evaluación de la integral 
doble mediante integración reiterada o repetida. E1 proceso consiste pues en 
integrar / respecto a x entre a y b (dejando fija y), y luego se integra el resultado 
respecto a y entre c y d. Si invertimos el orden de integración, obtenemos una 
fórmula parecida, a saber, 

(11.7) / J /(*, y) dx dy = £ [£f(x, y) dy] dx, 

Q 

que es válida si suponemos que j d c f(x,y)dy existe para cada x fija en [a, b] y 
que es integrable en [a, bj. 

11.7 Interpretación geométrica de la integral doble como un volumen 

E1 teorema 11.5 tiene una sencilla interpretación geométrica, representada en 
Ja figura 11.4. Si / es no negativa, el conjunto S de los puntos (x, y, z) en el es- 
pacio'de tres dimensiones tales que (x, y) está en Q y 0 ^ z ^ f(x, y) se llama 



Figura 11.4 El volumen de S es la integral del área de la sección: 
V (S) = jj A(y) dy. 
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conjunto de ordenadas de f sobre Q. Consta de los puntos comprendidos entre el 
rectángulo Q y la superficie z = f(x, y). (Véase figura 11.4 a).) Para cada y en 
el intervalo [c, d~\, la integral 


A(y) = j b J(x, y) dx 

es el área de la sección producida en S por un plano paralelo al plano xz (la 
región sombreada en la figura 11.4 b)). Puesto que el área de la sección A(y) 
es integrable en [c, d], el teorema 2.7 del volumen I nos dice que la integral 
ic My) dy es igual a v(5), el volumen de S. Así pues, para integrandos no nega- 
tivos, el teorema 11.5 muestra que el volumen del conjunto de ordenadas de / 
sobre Q es igual a la integral doble J/ /. 

Q 

La fórmula (11.7) nos da otro camino para calcular el volumen del con- 
junto de ordenadas. En ella integramos el área de las secciones producidas por 
planos paralelos al plano yz. 

11.8 Ejemplos resueltos 


En esta sección ilustramos el teorema 11.5 con dos ejemplos numéricos. 
ejemplo 1. SiQ = [ — 1,1] X [0, x/2], calcular JJ (xseny — ye^jdxdy. 

Q 

en el supuesto de que la integral exista. La región de integración está represen- 
tada en la figura 11.5. 




71/2] 



■0' 

Wm 

SSm. . 



1 


Figura 11.5 Región de integración para Figura 11.6 Región de integración para 
el ejemplo 1. e / ejemp i 0 2 . 
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Solución. Integrando primero respecto a x y llamando al resultado A(y), 
tenemos 

A (y) = J seny - ye x ) dx = seny - ye^ j *" 1 = -ey + y/e. 

Aplicando el teorema 11.5 encontramos 

JJ (x sen y — ye x ) dx dy = f*'*A (y) dy = f*'*(—ey + y/e) dy 
Q 

= (1/e - e) f’ 1 * ydy = (ì/e - e)rr 2 /8. 


Como comprobación del cálculo podemos integrar primero respecto a y: 

JJ (x sen y — ye x ) dx dy = jj t [ f’^ (x seny — ye x ) dyf dx 
Q 

= Jjj (-x cos y - y 2 e x ) dx 


= J 1 ^ (—■7r 2 e a! /8 + x) dx = (1/e — e)ir 2 ji. 

ejemplo 2. Si Q = [ —1, 1] X [0, 2], calcular la integral doble 
JJ _ x i\ dx dy, supuesta su existencia. 

Q 

Solución. S i integram os primero respecto a y y el resultado es H(x), tene- 
mos H(x) = Jo V |y — x 2 \ dy. La región de integración es el rectángulo de la 
figura 11.6. La parábola y = x 2 está allí dibujada debido a la presencia de 
|y — x 2 |en el integrando. Por encima de esa parábola se tiene y > x 2 y por de- 
bajo y < x 2 . Esto nos sugiere que escindamos la integral de H(x) del modo si- 
guiente: 

H(x) = jj V|y — X 2 | dy = f“ \JX 2 — y dy + jj 2 V y — x 2 dy. 

Recordemos que x se considera constante en cada una de esas integrales. En la 
primera efectuamos el cambio de variable t = x 2 — y y en la segunda t = y — x 2 . 
Esto nos da 


H ( x ) = / 0 V|y - x 2 | dy = —fffyft dt + jj - * Jtdt = fx 3 + f(2 - x 2 ) 3 ’ 2 . 
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Aplicando el teorema 11.5 encontramos 


JJ V |y - x 2 \ dx dy = [j x 3 + f (2 - x 2 ) 3/2 ] dx = i (2 - x 2 ) s/2 dx 

= ±|x(2 - xY 2 + 3xV2 - x 2 + 6arcsen0zJJ |' = | + ^ . 

Análogo resultado se consigue invirtiendo el orden de integración, pero los cálcu- 
los son más complicados. 


Calcular las integrales dobles por integración sucesiva en los ejercicios del 1 al 8, : 
puesta la existencia de cada integral. 


!• JJ xy(x +y)dxdy, donde Q = [0,1] x [0,1]. 

0 

2 - JJ (* 3 + 3 x 2 y +f)dxdy, donde Q = [0,1] x [0,1]. 

Q 

3 - JJ (V/ + x - 3 xy 2 )dxdy, donde Q = [0,1] x [1, 3]. 

Q 

+ JJ sen 2 xsen 2 ydxdy, donde Q = [0, *] x [0, +\. 

Q 

5 - J J sen (x + y) dx dy , donde Q = [0, tt/2] x [0, tt/2] . 

0 

6 - JJ lcos (x +_y)| dxdy, donde Q = [0, jt] x [0, ir]. 

Q 

J J/(* + j) dxdy, donde 2 = [0, 2] x [0,2], y /(/) representa el mayor 
Q 

entero <, t. 

8- JJ y~ 3 e tx ' v dxdy, donde Q = [0,/] x [1,/],/ >0. 

Q 

9. Si Q es un rectángulo, demostrar que una integral doble de la forma/J f(x)g(y) dx dy 

es ìgual al producto de dos integrales unidimensionales. Establecer las hipótesis relati- 
vas a la existencia. 
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10. Sea / una función definida en el rectángulo Q — [0,1] x [0,1] del siguiente modo: 


\\ -x-y si x + y <. 1, 

[0 en los demás puntos de Q. 

Representar el conjunto de ordenadas de / sobre Q y calcular su volumen por doble 
integración (Supóngase la existencia de la integral.) 

11. Resolver el ejercicio 10 cuando 


f(x,y) = 


si x*<.yú 2x 2 , 
en los demás puntos de Q. 


12. Resolver el ejercicio 10 cuando Q = [ — 1,1] X [—1,1] y 


[x 2 +y* si x 2 +y 2 £ 1 , 
f(x,ý) — L en j os j em ás puntos de Q. 

13. Sea / una función defmida en el rectángulo Q = [1,2] X [1,4] del siguiente modo: 

si x <.y ^ 2x, 
en los demás puntos de Q. 


f(x,y) ■ 


\x +y)~ 2 
0 


14. 


Indicar, mediante un dibujo, la porción de Q en la que / es no nula y calcular el valor 
de la integral doble JJ" /, supuesta su existencia. 


Sea / una función definida en el rectángulo Q = [0,1] X [0,1] del. siguiente modo: 

O 



si X =J, 

si x*y. 


Demostrar la existencia de la integral doble JJ" / y que es igual a 0. 


11.10 Integrabilidad de funciones continuas 

E1 teorema de la continuidad uniforme (teorema 9.10) puede aplicarse para 
demostrar la integrabilidad de una función continua en un rectángulo. 

TEOREMA 11.6. INTEGRABILIDAD DE FUNCIONES CONTINUAS. Si Una fun- 
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ción f es continua en un rectángulo Q = [a, 6] X [c, d}, entonces f es integra- 
ble en Q. Además, el valor de la integral puede obtenerse por integración su- 
cesiva, 

ttÌ-8) ííf = !* LC /(*, y) dx] dy = J* [j c d f(x, y) d J dx. 

Demostración. E1 teorema 9.8 demuestra^que f es acotada en Q, por lo que 
/ tiene una integral superior y una integral inferior. Demostraremos que 
/(/) = /(/). Elijamos e > 0. Según el teorema de la continuidad uniforme, para 
ese e existe una partición P de Q en un número fìnito (por ejemplo n) de sub- 
rectángulos Q lt ...,Q„ tal que la oscilación de / en todo subrectángulo es me- 
nor que e. Designemos con M»(/) y m*//), respectivamente, los valores máximo 
y mínimo absolutos de / en Q*. Tenemos entonces 

M k (f) - m k (f) < e 

para cada k = 1,2,...,«. Sean ahora s y t dos funciones escalonadas defìnidas 
en el interior de cada Q k así: 

j(jc) = m k (f), t(x) = M k (f) si x e int Q k . 

En los puntos frontera definamos s(jc) = m y t(x) = M, siendo m y M, respec- 
tivamente, los valores mínimo y máximo absolutos de / en Q. Tenemos entonces 
s < / < t para todo x de Q. Asimismo, tenemos 

/ J s = Ì m k (f)a(Q k ) y //» = Ì M k (f)a(Q k ), 

Q k=1 Q k=1 

en donde a(Q k ) es el área del rectángulo Q k . La diferencia de esas dos integra- 
les es 


// 1 ~ //* =î{M k (f) ~ m k (f)}a(Q k ) < efa(Q k ) = ea(Q), 

Q Q k ~ l k=1 

en donde a(Q) es el área de Q. Puesto que JJ s <, /(/) ^ /(/) < JJ t obtenemos 
la desigualdad Q Q 

0 <>I(f)- I(f) < ea(Q). 

Haciendo que e -> 0 vemos que /(/) = /(/), por lo que / es integrable en Q. 
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Demostramos seguidamente que la integral doble es igual a la integral 
reiterada de (11.8). Para cada y fija de [c,d] la integral unidimensional 
ía f( x > y) dx existe ya que el integrando es continuo en Q. Sea A(y)= J* f(x, y)dx. 
Demostraremos que A es continua en [c, </]. Si y e y^ son dos puntos cualesquie- 
ra de [c, d] tenemos 

A(ỳ) - AiyJ = £ {f(x, y) - f(x, yO} dx 
de la que obtenemos 

\A(y) - A(yJ\ < (b - a)maxjf(x, y) -f(x, yOI = (b - a) \f(x lt y) -f(x t , 

en donde x^ es un punto de [a, 6] en el que \f(x, y) — f(x, yJl alcanza su máxi- 
mo. Esta desigualdad demuestra que A(y) -> À(yf) cuando y -* y u así que A es 
continua en y t . Por consiguiente existe la integral § d c A(y) dy y, según el teorema 
11.5, es igual a JJ /. Se sigue un razonamiento parecido cuando el orden de in- 
. . Q 

tegracion se mvierte. 

11.11 Integrabilidad de funciones acotadas con discontinuidades 

Sea / una función definida y acotada en un rectángulo Q. En el teorema 
11.6 se demostró que la integral doble de / sobre Q existe si / es continua en 
todos los puntos de Q. En esta sección demostramos que también existe la inte- 
gral si / tiene discontinuidades en Q, con tal que el conjunto de las disconti- 
nuidades no sea demasiado grande. Para medir el tamano del conjunto de 
discontinuidades introducimos el concepto siguiente. 

DEFINICIÓN DE CONJUNTO ACOTADO DE CONTENIDO NULO. Sea A Un Subcon- 
junto acotado del plano. Se dice que el conjunto A tiene contenido nulo si para 
todo e > 0 existe un conjunto finito de rectángulos cuya reunión contiene A y 
cuya suma de áreas no supera e. 

Es decir, un conjunto plano acotado de contenido nulo puede cubrirse con 
una reunión de rectángulos cuya área total sea tan pequena como se quiera. 

Las siguientes proposiciones relativas a los conjuntos acotados de contenido 
nulo son sencillas consecuencias de esa definición. Dejamos al lector las demos- 
traciones. 

a) Cualquier conjunto finito de puntos del plano tiene contenido nulo. 

b) La reunión de un número finito de conjuntos acotados de contenido 
nulo también es de contenido nulo. 

c) Todo subconjunto de un conjunto de contenido nulo tiene contenido 
nulo. 
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d) Todo segmento de recta tiene contenido nulo. 

teorema 11.7. Sea f una función definida y acotada en un rectángulo 
Q — [a, b) X [c, d]. Si el conjunto de discontinuidades de f en Q es un con- 
junto de contenido nulo existe la integral doble // /. 

Q 

Demostración. Sea M > 0 tal que |/| ^ M en Q. Llamemos D al conjunto 
de discontinuidades de / en Q. Dado 8 > 0, sea P una partición de Q tal que la 
suma de las áreas de todos los subrectángulos de P que contienen puntos de D 
sea menor que 8.(Estô es posible puesto que D tiene contenido nulo.) Definamos 
en esos subrectángulos las funciones escalonadas s y t como sigue: 


í(jc) = —M, t(x) = M. 

En los subrectángulos de P restantes definamos s y t como se hizo en la demos- 
tración del teorema 11.6. Tenemos entonces s</<í en todo Q. Razonando 
como en la demostración del teorema 11.6 obtenemos la desigualdad 

(11.9) /Jf-/Js^e a (Ô) + 2Aíá. 

Q Q 

E1 primer término, ea(Q), procede del cálculo de la integral de t - s en los 
subrectángulos que sólo contienen puntos de continuidad de /; el segundo término, 
2M8, procede de la integral de t — s en los subrectángulos que contienen puntos 
de D. De (11.9) obtenemos la desigualdad 

0 ^ /(/) - I(f) <, ea(Q) + 2MÔ. 

Haciendo que e-»0 encontramos 0 </(/) —/(/)<2M8. Puesto que 8 es arbi- 
trario esto implica que /(/) = /(/), así que / es integrable en Q. 

11.12 Integrales dobles extendidas a regiones más generales 

Hasta aquí la integral doble sólo se ha definido para regiones de integración 
rectangulares. No obstante, no hay dificultad para extender el concepto a regio- 
nes más generales. Sea S una región acotada, e incluyamos S en un rectángulo Q. 
Sea / una función definida y acotada en S. Definamos una nueva función/ en Q 
del siguiente modo: 


Rx,y) = 


f( x >y) 

o 


si (x,ý)eS, 
si (x,y)<=Q — S. 


( 11 . 10 ) 
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Es decir, extendemos la defìnición de / a todo el rectángulo Q haciendo que la 
función valga 0 fuera de S. Nos preguntamos ahora si la función / es o no inte- 
grable en Q. Si lo es, decimos que f es integrable en S y que, por definición, 

S Q 

Consideremos primero conjuntos S de puntos del plano xy defìnidos así: 

S= {(x^ýf^a^x^b y yÁx) < y < <p 2 (x)}, 

en donde <p x y <p 2 son funciones continuas en un intervalo cerrado [a, 6] que sa- 
tisfacen tp^Çz. Ejemplo de una tal región, que llamamos región del tipo /, es el 
de la fìgura 11.7. En una región del tipo I, para cada punto t de [a, 6] la recta 
vertical x = t corta a S en un segmento que une la curva y =<pi(x) a y =<p 2 (x). 
Una tal región es acotada porque cpi y <p 2 son continuas y por tanto acotadas en 
ía.bl 

Otro tipo de región T (tipo II) puede definirse así: 

T={(x,y)\c<,y <d y f^ý) <, x < y> 2 (y)}, 


en donde y son continuas en un intervalo [c, d] siendo ^ ỳ 2 . En la figu- 
ra 11.8 se muestra un ejemplo. En este caso las rectas horizontales cortan T en 



Figura 11.7 Región S de tipo I. 


Figura 11.8 Región T de tipo II. 
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segmentos que unen las curvas x x = ^.(y) y x 2 = Ý 2 (y). Las regiones del tipo II 
también son acotadas. Todas las regiones que consideraremos serán de uno u 
°tro de esos dos tipos o podrán descomponerse en un número finito de fragmen- 
tos, cada uno de los cuales será de uno de esos dos tipos. 

Sea / una función definida y acotada en una región S de tipo I. Incluya- 
mos S en un rectángulo Q y definamos / en Q como está indicado en la ecuación 
(11.10). Las discontinuidades de / en Q serán las de / en S y además aquellos 
Puntos de la frontera de S en los que / no es cero. La frontera de S está cons- 
tituida por las gráficas de rp ^, de rp 2 y por Jos dos segmentos de recta verticales 
que unen los extremos de las gráficas. Cada uno de esos segmentos de recta tiene 
contenido nulo. E1 teorema que sigue demuestra que cada una de las gráficas tam- 
bién tiene contenido nulo. 

teorema 11.8. Si rp es una función real continua en un intervalo \a, b], 
entonces la gráfica de rp tiene contenido nulo. 

Demostración. Designemos con A la gráfica de <p, esto es, pongamos 

A = {{x,y)\y = rp(x) y a<,x<b}. 

Elijamos cualquier e > 0. Apliquemos el teorema de la continuidad uniforme 
(teorema 3.13 del volumen I) para obtener una partición P de \a, b ] en un nú- 
mero finito de subintervalos tales que la oscilación de rp en todo subintervalo de 
P sea menor que e/(b - a) Por consiguiente, en cada subintervalo de P la grá- 
fica de rp está dentro de un rectángulo de altura e/(b - a). Luego toda la grá- 



h 


Figura 11.9 Demostración de que la gráfica de una función continua <p tiene contenido nulo . 
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fica de <p queda incluida en una reunión finita de rectángulos, cuya suma de áreas 
es e. (Véase la figura 11.9.) Esto demuestra que la gráfica de <p tiene contenido nulo. 
E1 teorema siguiente demuestra que la integral doble // / existe si f es con- 

tinua en int S, (el interior de S). Éste es el conjunto 

int S = {(xr, ý)\a <L x < b y <Pi(x) < y < <pi(x)} . 

teorema 11.9. Sea S una región del tipo I, comprendida entre las gráficas 
de <p, y<p 2 . Supongamos que f está definida y es acotada en S y que es continua 
en el interior de S. Existe entonces la integral doble j/ / y puede calcularse me- 
diante integración uni-dimensional reiterada. 

(11.11) JJ/(*. y) dx dy = J* [^>, y) dy] dx. 

s 

Demostración. Sea Q = [a, 6] X [c, d] un rectángulo que contiene S, y 
sea /la función definida en (11.10). Los únicos puntos que pueden ser de dis- 
continuidad para / son los de la frontera de S. Puesto que la frontera de S tiene 
contenido nulo, / es integrable en Q. Para cada x de (a, b) fijo existe la integral 
unidimensional jf/ (x, y) dy puesto que el integrando tiene a lo más dos discon- 
tinuidades en [ c, d]. Aplicando la versión del teorema 11.5 dada en la ecuación 
(11.7) tenemos 

(11.12) í//=f [f/(x,y)dy] dx. 

Q 

Si ?Ax) < y < ? 2 (x),f(x,y) = f(x, y), y para los demás valores de y en [c, d], 
f(x, y) = 0. Por consiguiente 

J a j(x, y) dy = C’/íx, y) dy 

por lo cual la ecuación (11.12) implica (11.11). 

Existe, naturalmente, un teorema análogo para una región T del tipo II. 
Si / está definida y es acotada en T y es continua en el interior de T, f es inte- 
grable en T y la fórmula para la integración reiterada es ahora 

(11.13) // /(*> y ) dx dy = jj [Jj* < ’ ) f(x, y) dx] dy. 

T 

Ciertas regiones son del tipo I y del tipo II a la vez. (Por ejemplo regiones 
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limitadas por circunferencias y elipses.) En estos casos el orden de integración es 
indiferente y podemos escribir 

la [/JX > >/(x ’ y) dy i dx = f [fr^ y) dx i d y ■ 

En algunos casos una de esas integrales puede ser de cálculo más sencillo que 
la otra; es conveniente examinarlas antes de intentar el cálculo. 

í 1.13 Aplicaciones a áreas y volúmenes 

Sea S una región del tipo I dada por 

s = y) I a ^ ^ y <páx) £y<, <p 2 (x )}. 

Aplicando el teorema 11.9 poniendo f(x, y) = 1 para todo (x, y) de S obtenemos 
// dxdy = // [<p 2 (x) - çsjfx)] dx. 


Según el teorema 2.1 del volumen I, Ia integral del segundo miembro es igual al 
área de la región S. Así pues, las integrales dobles pueden emplearse para calcular 
áreas. 

Si / es no negativa, el conjunto de puntos (x, y, z ) del espacio de tres dimen- 
siones tales que (x, y)eS y 0 ^ z ^ f(x, y) se denomina conjunto de ordenadas 
de f sobre S. En la figura 11.10 se ve un ejemplo. Si / es no negativa y continua 
en S, la integral 


representa el área de una sección del conjunto de ordenadas producida al cortarlo 
por un plano paralelo al plano yz (región sombreada de la figura 11.10). La 
fórmula (11.11) del teorema 11.9 demuestra que la integral doble de / sobre S 
es igual a la integral del área de las secciones. 'Luego la integral doble // / es 

igual al volumen del conjunto de ordenadas de / sobre S. (Véase el teorema 2.7 
del volumen I, pág. 139.) 

En general, si / y g son ambas continuas en S siendo / < g, la integral doble 
//(?“/) es igual al volumen del sólido comprendido entre las gráficas de las 

íunciones / y g. A las regiones del tipo II se aplican observaciones análogas. 



Ejemplos resueltos 


451 , 



Figura 11.10 La integral J* 1 ^' f(x,ỳ)dyes el área de la sección del conjunto de ordenadas. 
La integral reiterada y) dŷ^ dx es el volumen del conjunto de ordenadas. 

11,14 Ejemplos resueltos 

ejemplo 1. Calcular el volumen del sólido limiiado por el elipsoide 



Solución. E1 sólido en cuestión está comprendido entre las gráficas de las 
dos funciones / y g, siendo 

g(x, y) = csj\ - x*la 2 - y 2 /b 2 /( v. v) = -g(x, y), 

Aquí (x, y)eS, siendo S la región elíptica dada por 
S = ((x, y) | + £ < l} • 

Aplicando el teorema 11.9 y teniendo en cuenta la simetría encontramos que el 
volumen V del sólido elipsoidal viene dado por 

V = jJ(g— f) = 2 JJ g = 8c /“ [J 0 &Vl 1/0 Vl - x 2 la 2 - y 2 /b 2 dy ] dx. 
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Pongamos A = \/l — x 2 ja 2 . La integral interior e 


J 0 \IA 2 — y 2 jb 2 dy = A j* A V1 — y 2 j(Ab) 2 dy. 


Mediante el cambio de variable y = Ab sen t, dy = Ab cos t dt, encontramos 
que la última integral es igual a 

A 2 b j’ 12 cos 2 tdt = ?A 2 b = ^ 1 - . 

Por consiguiente 

K - fc ír( 1 -â 

En el caso particular a = b= c el sólido es una esfera de radio a y el volumen 
es %tt a a . 

ejemplo 2. La integral doble de una función positiva /, JJ f(x, y) dx dy, 
se reduce a la integral reiterada s 

/: jo 

Determinar la región S e intercambiar el orden de integración. 

Solución. Para cada x fijada entre 0 y 1, la integración con respecto a y se 
efectúa en el intervalo entre x 2 y x. Esto significa que la región es del tipo I y 
está limitada entre los dos curvas y = x 2 e y = x. La región S es el conjunto de 
puntos situados entre las dos curvas y sobre el intervalo [0, 1]. (Véase figura 
11.11) Puesto que S es también del tipo II podemos invertir el orden de integra- 
ción obteniendo 


/: [//*/(*, y) dx] dy. 

ejemplo 3. Una integral doble de una función f, JJ f(x, y) dx dy, se reduce 
a la integral reiterada: s 


f [//f ” /(*. y) dx] dy. 

Determinar la región S e invertir el orden de integración. 
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Solución. Para cada y fija entre 0 y 3, la integración respecto axse efectúa 
en el intervalo entre 4y/3 y V 25 — y\ Por lo tan to la regi ón es del tipo II y 
'está limitada por las dos curvas x = 4y/3 y x = V 25 — y*. Esta región, repre- 
sentada en la figura 11.12, es un sector circular. Cuando el orden de integración 
se invierte, la región se escinde en dos regiones del tipo I; el resultado es la 
suma de dos integrales: 

/o LT ^ y) dy ì dx+ f /(x> y) dy ^ dx - 

11.15 Ejercicios 

En los ejercicios del 1 al 5, dibujar la región de integración y calcular la integral doble. 

1. J/x cos (x + y) dx dy, siendo S el triángulo de vértices (0,0), ( 71 -, 0), (w, n). 
s 

2. JJ ( 1 + x) sen y dx dy, siendo S el trapezoide de vértices ( 0 , 0 ), ( 1 , 0 ), ( 1 , 2 ), ( 0 , 1 ). 

s 

3. JJ e x+v dxdy, siendo S = {(x,y) | |*| + |y| ^ 1}. 

S 

4 . J J jriy 2 dx dy, siendo S la porción acotada del primer cuadrante situada entre las dos 
hipérbolas xy = 1 y xy = 2 y las líneas rectas y = x e y = 4x. 

5. J J (x 1 — y 2 ) dx dy, siendo S la región limitada por y = sen x y el intervalo [ 0 , tr]. 
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Una pirámide está limitada por Ios tres planos coordenados y el plano x + 2y + 3z = 6. 
Representar el sólido y calcular su volumen por doble integración. 

Un sólido está limitado por la superficie z = x? - ỳ, el plano xy, y los planos x = 1 
y x = 3 - Representar el sólido y calcular su volumen por doble integración. 

Calcular por doble integración, el volumen del conjunto de ordenadas de / sobre S si: 


a ) f(x,y) = x 2 + / 
b )f(x,y) =3 x + y 
c) f(x,y) = y + 2x + 20 


y 

y 

y 


s = {(*..y)| 1*1 <i,l+| < i}. 
s = ((*,+) | 4x 2 + 9y 2 ^ 36, x > 0, y > 0} . 
s = {(*,+) \x 2 +y 2 <, 16}. 


En los ejercicios del 9 al 18 suponer que la integral doble de una función positiva / exten- 
dida a una región S se reduce a la integral reiterada que se da. En cada caso, representar la 
región S e invertir el orden de integración. 


9 - \l[\lf(x,y)dx~\ dy. 

10 - í:u>^ dx ] dy - 

u - \l[il-f {x 'y )d y] dx - 

12, m f( x ’y)*y\dx. 

13 - I 2 SIT x Z,J( x ' y)dy ] dx - 


14 /i'Lío' vt f( x >y> d ŷ\ dx - 

15 - /<*» y) d y\ dx ■ 

16 - ÍoUx>f (X ^ )d fi dx - 

17 ■ dx - 

is - /o [/r^ f (x ’ y) dx ] dy • 


19. A1 calcular por doble integración el volumen V situado debajo del paraboloide 
z = x 2 + y 2 y limitado inferiormente por una cierta región S del plano xy, se ha Uegado 
a la siguiente suma de integrales reiteradas: 


V ~ / 0 [/ 0 + /) dx ] d y + /j [J 0 (x 3 + y 2 ) dx] dy. 


Dibujar la región S y expresar V mediante una integral reiterada en la que el orden de 
integración esté invertido. Efectuar, también, Ia integración y calcular V. 

20. Al calcular por doble integración el volumen V limitado por encima por la superficie 
z =/(*, y) y por la parte inferior por una cierta región S del plano xy, se ha Uegado a 
la siguiente suma de integrales reiteradas; 


v = \Z C [\s^Z (x ’ y)dx ] dy + f( x >y ) dx ] dy ■ 


Siendo 0 < a < b y0<c< ir/2, dibujar la región S dando Ias ecuaciones de todas las 
curvas que constituyen su frontera. 

21. A1 calcular por doble integración el volumen V limitado por encima por la superficie 
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z = f(x, y ) y por la parte inferior por una cierta región S del plano xy, se ha llegado a la 
siguiente suma de integrales reiteradas: 

v = Ji [/; y) dy \ dx + /2 [JI f (x ’ y) dy \ dx ■ 

a) Dibujar la región S y expresar el volumen V mediante una integral reiterada en la 
que el orden de integración esté invertido. 

b) Efectuar la integración y calcular V cuando f(x, y) = e x (xly) l/2 . 

22. Dadas A = e~‘ 2 dt y B= e~ t2 dt. Calcular la integral reiterada. 

/ = 2j; , [J* e~ v * dyj dx 

en función de A y B. Existen enteros positivos m y n tales que 
I = mA - nB + e~ l - e~ lli . 

Comprobar esta relación con los resultados obtenidos. 

23. Un cono se obtiene uniendo todos los puntos de una región plana S con un punto no 
situado en el plano de S. Designando con A el área de S, y con b la altura del cono. 
Demostrar que: 

a) E1 área de la sección producida por un plano paralelo a la base y a distancia t del 
vértice es (t/h) 2 A, si 0 < t < h. 

b) E1 volumen del cono es %Ah. 

24. Invertir el orden de integración para deducir la fórmula 

[0 [Jo em '' a ~ XÌ f( x) ílx \ (l y = J" ( a - x)e m(a ~ x) f(x) dx, 

donde a y m son constantes, a > 0. 


11.16 Otras aplicaciones de las integrales dobles 

Ya hemos visto que las integrales dobles pueden usarse para calcular volú- 
menes de sólidos y áreas de regiones planas. Otros muchos conceptos tales como, 
masas, centros de gravedad y momentos de inercia pueden definirse y calcularse 
con el auxilio de integrales dobles. En esta sección se exponen brevemente estos 
problemas que tienen especial importancia en física e ingeniería. 

Sea P el vector que une el origen con un punto cualquiera de E 3 . Si n masas 
positivas m lt m 2 ,... ,m„ están localizadas en los puntos P lt P 2 ,... ,P n respec- 
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tivamente, el centro de gravedad del sistema se define como el punto C determi- 
nado por el vector 

^ 2”=i m k P k 

E1 denominador, se llama masa total del sistcma. 

Si cada masa m k se traslada según un vector A a un nuevo punto Q k siendo 
Q k — P k + A, el centro de gravedad también experimenta la traslación A , puesto 
que se tiene 


2 m k Q k ~ 2, m k( p k + A) 2 m k P k 

2 m k 2m k ~2m k + 


— C -f- A . 


Esto también se expresa diciendo que la posición del centro de gravedad depende 
tan sólo de los puntos P k , P 2 ,..., P n y de las masas, y no de la situación del 
origen. E1 centro de gravedad es una cantidad calculada teóricamente que repre- 
senta, por así decirlo, un ficticio «punto de equilibrio» del sistema. 

Si las masas están en un plano en los puntos de coordenadas (x x , yi),..., 
( x„, y„), y si el centro de gravedad tiene coordenadas (Jc, ŷ), la relación vectorial 
que define C puede expresarse con dos ecuaciones escalares, 



y 


ŷ=^. 

2 m k 


En el numerador del cociente que define Jc, el término fc-ésimo de la suma, m k x k , 
se denomina el momento de la masa m k respecto al eje y. Si una masa m igual a 
la masa total del sistema fuese situada en el centro de gravedad, su momento 
respecto al eje y sería igual al momento del sistema 


mx = 2 m k x k • 


Cuando nos referimos a un sistema cuya masa total está distribuida en una 
cierta región del plano en lugar de estar situada en un número finito de puntos 
aislados, los conceptos de masa, centro de gravedad y momento se definen me- 
diante integrales en lugar de hacerlo con sumas. Por ejemplo, consideremos una 
«fina lámina» que tenga la forma de una región plana S. Supongamos que la ma- 
teria está distribuida por toda la lámina con una densidad conocida (masa por 
unidad de área). Con ello significamos que existe una función / no negativa defi- 
nida en S y que f(x, y) representa la masa por unidad de área en el punto (x, y). 
Si la lámina o placa está construida con un material homogéneo la densidad es 
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constante. En tal caso la masa total de la lámina se define como el producto de 
la densidad por el área de la lámina. 

Cuando la densidad varía de un punto a otro utilizamos la integral doble de 
la densidad como definición de la masa total. Es decir, si la función densidad / 
es integrable en S, definimos la masa total m(S) de la lámina mediante la fórmula 


E1 cociente 


™(s) = y) dx d y - 

s 


masa 

área 


JJ/(x, y) dx dy 
s _ 

JJ dx dy 


se llama densidad media de la lámina. Si consideramos que S no es precisamente 
una lámina delgada, sino una figura geométrica de dos dimensiones, el anterior 
cociente se llama promedio o valor medio de la función / sobre la región S. En 
este caso no exigimos que / sea no negativa. 

Por analogía con el caso finito, definimos el centro de gravedad de la lámina 
como el punto (x, ỳ) determinado por las fórmulas 

(11.14) xm(S) = jjxf(x, y) dx dy y ŷm(S) = // if(x, y) dx dy. 


Las integrales del segundo miembro son los momentos de la lámina respecto 
a los ejes y y x respectivamente. Cuando la densidad es constante, f(x, y) = c, se 
simplifica las igualdades (11.14) y obtenemos 


xa(S) : 


■//* 


= jj ydxdy. 


donde a(S) es el área de S. En este caso el punto (x, ỳ) se denomina el centroide 
de la lámina (o de la región S). 

Si L es una recta en el plano de la lámina y representamos con S(x, y) la 
distancia desde el punto (x, y) de S a la recta L, el número I L definido por 

h. = // ô \x, y)f(x, y) dx dy 


se llama momento de inercia de la lámina respecto a L. Si f(x, y) = 1, I L se deno- 
mina momento de inercia o segundo momento de la región S respecto a L. Los 
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momentos de inercia respecto a los ejes xeyse designan con I x e I y , respectiva- 
mente, y vienen dados por las integrales 

I x = jj y 2 f(x,y)dxdy y I v = J/x 2 /(x, y) dx dy. 
s s 

La suma de esas dos integrales se llama momento polar de inercia J 0 respecto al 
origen: 


J 0 = I x + I y = // (x 2 + y*)f(x, y) dx dy. 


Nota. La masa y el centro de gravedad de una lámina tienen propiedades que 
dependen del cuerpo y no de la situación del origen y de las direcciones de los ejes 
coordenados. E1 momento polar de inercia dependé de la posición del origen, pero 
no de las direcciones de los ejes. Los momentos y momentos de inercia respecto a 
los ejes x e y dependen de la situación del origen y de las direcciones de los ejes. 
Si una lámina de densidad constante posee un eje de simetría, su centroide estará 
en dicho eje. Si tiene dos ejes de simetría, el centroide estará en su intersección. 
Estas propiedades pueden demostrarse a partir de las defîniciones que preceden, 
y son muy útiles, pues simplifican frecuentemente los cálculos. 

ejemplo 1. Una lámina delgada de densidad constante c está limitada por 
dos circunferencias concéntricas de radios a y b y centro en el origen, siendo 
0 < b < a. Calcular el momento polar de inercia. 

Solución. La integral para calcular J 0 es: 

J 0 = c/J O 2 + y*)dxdy, 

s 

siendo S = {(x, y) \ b 2 ^ x 2 + y 2 ^ a 2 }. Para simplificar los cálculos tengamos en 
cuenta que la integral es una función aditiva en la región de integración (ya que 
el integrando es no negativo), de modo que tenemos: 

I Q = c JJ (x 2 + y 2 ) dxdy — c JJ (x 2 + y 2 ) dx dy, 

donde S(a ) y S(b) son los discos circulares de radios a y b, respectivamente. Pode- 
mos usar la integración reiterada para calcular la integral extendida a S(a), y en- 
contramos 


II* 


+ y 2 ) dx dy 


-ffl' 


(x 2 + y 2 ) dy 


']*- î 
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(Omitimos los detalles de cálculo debido a que esta integral puede calcularse más 
fácilmente en coordenadas polares, lo que se expondrá en la sección 11.27.) Por 
lo tanto. 


I 0 = — (a i - h*) = 7 Tc(a 2 - b 2 ) y - 


2 + b 2 
2 ’ 


donde m — tt c(a 2 — b 2 ) es la masa de la lámina. 

ejemplo 2. Determinar el centroide de la región plana limitada por un 
arco de sinusoide. 

Solución. Consideremos la región S limitada por la curva y = sen x y el 
intervalo 0 ^ x ^ ■*. Por la simetría, la coordenada x del centroide es x = ir/2. 
La coordenada y viene dada por 

Sh'dxdy $l(Sr x ydy]dx Jîèsen 2 xdx ^ 

y jjdxdy Jjsenxdx 2 8 

s 


11.17 Dos teoremas de Pappus 

Pappus de Alejandría, que vivió en la segunda mitad del siglo tercero, fue 
uno de los últimos geómetras de la escuela de Alejandría de matemáticos griegos. 
Escribió un compendio de ocho libros en los que recogió gran parte de los cono- 
cimientos matemáticos de aquel tiempo. (Se conservan los seis últimos y una parte 
del segundo.) Pappus descubrió numerosas propiedades interesantes de los cen- 
troides, dos de las cuales exponemos en esta sección. La primera relaciona el 
centroide de una región plana con el volumen del sólido de revolución obtenido 
por la rotación de la citada región alrededor de una recta de su plano. 

Consideremos una región plana Q situada entre las gráficas de dos funciones 
continuas / y g en el intervalo [a, &], siendo 0 - g - f. Sea S el sólido de revo- 
lución engendrado al girar Q alrededor del eje x. Designemos por a(Q) el área 
de Q, v(S) el volumen de S, y con ŷ la coordenada y del centroide de Q. A1 girar 
Q para engendrar S, el centroide se desplaza a lo largo de una circunferencia de 
radio ŷ. E1 teorema de Pappus establece que el volumen de S es igual al producto 
de la longitud de esa circunjarencia multiplicada por el área de Q; esto es. 


( 11 . 15 ) 


v(S) = 2irŷa(Q). 
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Para demostrar esta fórmula observemos tan sólo que el volumen viene dado 
por la integral 


v(S) = tt jj [f ‘\x) - g\x)] dx 


y que y se obtiene con la fórmula 


ŷa(Q) = JJ ydydx = jj’ [ y dyj dx = jj i[f \x) - g-(.v)] dx. 

Q 

Comparando esas dos fórmulas se obtiene inmediatamente (11.15). 

ejemplo 1. Volumen de un toro. Sea S el toro engendrado al girar un 
disco circular Q de radio R alrededor de un eje a una distancia b > R del cen- 
tro de Q. E1 volumen de S se calcula fácilmente con el teorema de Pappus. Tene- 
mos ŷ = b y a(Q) = irR 2 , así que 

v(S) = InŷaiQ) = 2t r 2 R 2 b. 

E1 ejemplo que sigue hace ver que el teorema de Pappus también puede usar- 
se para determinar centroides. 

ejemplo 2. Centroide de un disco semicircular. Sea ŷ la coordenada y del 
centroide del disco semicircular 


Q = {(x,y)\x 2 +y 2 ^R 2 , j>0}. 

E1 área de Q es brR 2 . Cuando Q gira alrededor del eje x engendra una esfera 
de volumen %~R\ Según la fórmula de Pappus tenemos 


4 R 

asi que y = — • 


|77 R 3 = 2irŷ(^nR 2 ), 


E1 teorema de Pappus que sigue estabiece que el centroide de la reunión de 
dos regiones planas disjuntas A y B está en el segmento de recta que une el cen- 
troide de A con el centroide de B. Con mayor generalidad, sean A y B dos lámi- 
nas delgadas que son disjuntas o se cortan en un conjunto de puntos de conte- 
nido nulo. Designemos con m(A) y m(B) sus masas y con C, y C n los vectores 
c|ue unen el origen con los respectivos centros de gravedad. La reunión A\j B 
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tiene entonces masa m(A) + m(B) y su centro de gravedad está determinado por 
el vector C dado por la fórmula 


(11.16) 


c _ m(Â)C A + m(B)C B 
m(A) + m(B) 


E1 cociente que da C es una combinación lineal de la forma aC A + bC B , en la 
que a y b son escalares no negativos cuya suma es 1. Una combinación lineal de 
esta forma se llama combinación convexa de C A y C B . E1 extremo de C está situa- 
do en el segmento de recta que une los extremos de C A y C B . 

La fórmula de Pappus (11.16) se deduce inmediatamente de la definición de 
centro de gravedad que se da en (11.14). Puede generalizarse de manera sencilla 
a la reunión de tres o más regiones. Es útil especialmente en la práctica cuando 
una lámina de densidad constante se compone de varias porciones, cada una de 
las cuales tiene simetría geométrica. Determinamos el centroide de cada porción 
y formamos luego una adecuada combinación lineal para encontrar el centroide 
de la reunión. En el ejercicio 21 de la sección siguiente se dan ejemplos. 


11.18 Ejercicios 


En los ejercicios del 1 al 8 la región S está limitada por una o más curvas de las que se 
dan las ecuaciones. En cada caso dibujar la región S y determinar las coordenadas x e ŷ del 
centroide. 


1. y=x\ x+y= 2. 

2. y 2 = x + 3, f = 5 -x. 

3. x-2y + 8=0, x + 3y + 5 = 0, x = -2, x =4. 

4. y=sen 2 ;t, _y=0, 

5. j = sen a;, j=cosx, 0£x<,^. 

6. y=logx, y= 0, l<x<,a. 

7. y/x + >Jy = 1, *=0-, j=0. 

8 . x 2/í + y % =1, x = 0, y = 0, en el primer cuadrante. 

9. Una lámina delgada está limitada por el arco de parábola y = 2x — x 2 y el intervalo 
0 < x < 2. Determinar su masa si la densidad en cada punto (x,y) es (1 — y)/(l + x). 

10. Determinar el centro de gravedad de una lámina delgada rectangular ABCD si la den- 
sidad en todos sus puntos es el producto de sus distancias a los lados AB y AD. 

En los ejercicios 11 a 16 calcular los momentos de inercia I, e I y de una lámina delgada 
S del plano xy bordeada por una o más curvas cuyas ecuaciones se citan. En cada caso 
f(x, y) representa la densidad de un punto cualquiera (x, y) de S. 

11. y = sen* x, y=~ sen 2 x, 


<. X <, n; 


f(x,y) = ì. 
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12. +| = 1 , ^+| = 1 , y = 0 , 0 < c < a, b> 0 ; f(x,y) = 1. 

13. (x — r) 2 + (y — r) 2 = r 2 , x=0, j=0, 0 <; a: ^ r, 0 £ y <, r ;f(x, y) = 1 . 

14. xy = 1, xy = 2, x = 2y, y =2x, a :> 0 , y > 0 ; f(x,y) = 1. 

15. y=e*, y= 0, 0<x<a; f(x,y)=xy. 

16 . y = y/2x, y= 0, 0£x<2; f(x,ỳ) = \x - y\. 

17. Sean S una lámina delgada de masa m, y L, y L dos rectas paralelas en el plano de S, 
pasando L„ por el centro de gravedad de S. Demostrar el teorema de los ejes paralelos: 

4 = 4 0 +™h 2 , 

donde h es la distancia entre las dos rectas L 0 y L. [Itidicación. E1 trabajo se simplificará 
con una adecuada elección de los ejes coordenados.] 

18. E1 contorno de una lámina delgada es una elipse de semiejes a y b. L representa una 
recta en el plano de la lámina que pasa por el centro de la elipse y forma un ángulo a 
con el eje de longitud 2 a. Si la densidad es constante y la masa m, demostrar que el 
momento de inercia h es igual a J m(a 2 sen 2 a + b 2 cos 2 a). 

19. Encontrar la distancia media desde un vértice de un cuadrado de lado h a los puntos 
interiores del mismo. 

20. Sea S la distancia desde un punto atbitrario P interior a un círculo de radio r a un punto 
fijo P„ cuya distancia al centro del círculo es h. Calcular el valor medio de la función 
S 2 en la región limitada por el círculo. 

21. Sean A, B, C los siguientes rectángulos del plano xy: 

A = [0,4] x [0,1], B = [2,3] x [1,3], C=[ 2, 4] x [3,4]. 

Aplicar el teorema de Pappus para determinar el centroide de las siguientes figuras: 

a) A u B. c) B u C. 

b) A u C. d ) AVBVC. 

22. Un triángulo isósceles T tiene base 1 y altura h. La base de T coincide con uno de los 
lados de un rectángulo R de base 1 y altura 2. Encontrar el valor de h de manera que 
el centroide de R u T esté situado en el lado común de R y T. 

23. Un triángulo isósceles T tiene base 2 r y altura r. La base de T coincide con el lado 
recto de un disco semicircular D de radio r. Determinar la relación que debe existir 
entre r y h para que el centroide de T U D esté situado en el interior del triángulo. 


11.19 Teorema de Green en el plano 

E1 segundo teorema fundamental* del cálculo para las integrales de línea es- 
tablece que la integral de,línea de un gradiente V/ a lo largo de un camino que 
une dos puntos a y b puede expresarse en función de los valores f (a) y f(b). Exis- 
te un teorema análogo en dos dimensiones que expresa una integral doble exten- 
dida à una región R como una integral de línea a lo largo de la curva cerrada 
que constituye la frontera de R. Este teorema corrientemente se denomina teorema 
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de Green, (*) pero a veces se llama teorema de Gauss. Puede establecerse de va- 
rias maneras; la más frecuente es en la forma de la identidad: 

(1U7) + 

R 

La curva C que aparece en el segundo miembro es el contomo de la región R, y 
el símbolo de integración <j> indica que la curva se recorre en el sentido contrario 
al de las agujas del reloj, como se ve en la figura 11.13. 



Figura 11.13 La curva C es la frontera de R, recorrida en el sentido contrario al de las 
agujas del reloj. 

Se precisan dos tipos de hipótesis para la validez de la identidad. Primero, se 
imponen condiciones a P y Q a fìn de asegurar la existencia de las integrales. Las co- 
rrientes son que P y Q sean derivables con continuidad en un conjunto abierto S 
que contenga la región R. Esto implica la continuidad de P y Q sobre C así como la 
continuidad de dP/dy y dQ/dx en R, aunque el teorema también es cierto con 
hipótesis menos restrictivas. Segundo, hay otras condiciones de tipo geométrico 
que se imponen a la región R y a su contorno C. La curva C puede ser cualquier 
curva cerrada simple rectificable. La palabra «rectificable» significa, natural- 
mente, que C tiene una longitud finita. A fin de explicar lo que se entiende por 
curva cerrada simple, nos referiremos a la función vectorial que describe la curva. 

En honor a George Green (1793-1841), matemático inglés que estudió las aplicaciones 
matemáticas a la electricidad y magnetismo, flujo de fluidos, y a la reflexión y refracción de la 
luz y del sonido. E1 teorema que lleva el nombre de Green aparece ya en las investigaciones 
de Gauss y de Lagrange. 
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Supongamos que C viene descrita por una función vectorial continua a defi- 
nida en un intervalo [a.ft]. Sia(a) =a(b), la curva es cerrada. Una curva cerrada 
tal que a(U) ¥= a.(t 2 ) para todo par de valores t, 4 del intervalo semiabierto 
(a, b ] se llama curva cerrada simple. Esto significa que, excepto para los extre- 
mos del intervalo [a, 6], valores distintos de t originan puntos distintos de la 
curva. La circunferencia es el típico ejemplo de curva cerrada simple. 

Las curvas cerradas simples planas se llaman corrientemente curvas de Jordan 
en recuerdo de Camilo Jordan (1838-1922), famoso matemático francés que fue 
de los primeros que trabajó sobre los conceptos de curvas cerradas simples y de 
longitud de arco. Toda curva de Jordan C descompone el plano en dos conjuntos 
abiertos conexos y disjuntos que tienen la curva C como frontera común. Una de 
esas regiones es acotada y se llama interior a C. (Véase la región sombreada en 
la figura 11.13.) La otra es no acotada y se llama exierior a C. Para ciertas curvas 
de Jordan familiares como circunferencias, elipses, o polígonos elementales, es 
intuitivamente evidente que la curva divide al plano en una región interior y otra 
exterior, pero demostrai que es esto cierto para una curva de Jordan cualquiera 
no es cosa fácil. Jordan fue el primero en precisar que esa afirmación requería 
demostración; el resultado se conoce por el nombre de teorema de la curva de 
Jordan. Hacia fines del siglo xix Jordan y otros publicaron demostraciones incom- 
pletas. En 1905 el matemático americano Oswald Veblen (1880-1960) dio Ia pri- 
mera demostración completa del teorema. E1 teorema de Green es válido siempre 
que C es una curva rectificable de Jordan, y la región R es la reunión de C y de 
la región interior a ella. (*) Puesto que no hemos definido las integrales de línea 
a lo largo de curvas rectificables cualesquiera, limitamos nuestra discusión a cur- 
vas regulares a Irozos. 

Existe otra dificultad técnica asociada a la formulación del teorema de Green. 
Ya hemos observado que, para la validez de la identidad (11.17), la curva C debe 
ser recorrida en sentido contrario al de las agujas del reloj. Intuitivamente, esto 
significa que un hombre que vaya andando a lo Iargo de C tiene siempre la re- 
gión R a su izquierda. También, para algunas curvas de Jordan corrientes, como 
las antes mencionadas, el significado de la expresión «recorrer una curva en sen- 
tido contrario al de las agujas del reloj» es intuitivamente evidente. No obstante, 
en una demostración estrictamente rigurosa del teorema de Green se debería defi- 
nir esta expresión en términos completamente analíticos, esto es, mediante la 
función vectorial a que describe la curva. En la sección 11.24 se esboza una posi- 
ble definición. 

Habiendo ya senalado algunas de las dificultades asociadas a la formulación 
del teorema de Green, lo enunciaremos en una forma más bien general e indica- 
remos brevemente por qué es válido para ciertas regiones. En esta discusión el 


(*) En el capítulo 10 de la obra del autor Análisis matemático, se puede ver una de- 
mostración del teorcma de Green para regiones de tal generalidad. 
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significado de «contrario al de las agujas del reloj» es intuitiva, de manera que 
la demostración no es completamente rigurosa. 

TEOREMA 11.10. TEOREMA DE GREEN PARA REGIONES PLANAS LIMITADAS 
por curvas de jordan regulares A trozos. Sean P y Q campos escalares deri- 
vables con continuidad en un conjunto abierto S del plano xy. Sea C una curva 
de Jordan regular a trozos, y representemos por R la reunión de C y de su inte- 
rior. Supongamos que R está contenida en S. Se tiene entonces la identidad 

(iu8) SÍ(^-d ,,xdy -i Fdx+Qdy ' 

R 

en îa que la integral de línea se toma alrededor de C en sentido contrario al de 
las agujas del reloj. 

Nota. La identidad (11.18) es equivalente a las dos fórmulas 


(11.19) 



En efecto, si estas dos fórmulas son válidas, sumando se deduce (11.18). Recíproca- 
mente, si (11.18) es cierta podemos obtener (11.19) y (11.20) como caso particular 
tomando P = 0 y Q = 0, respectivamente. 

Demostración para regiones especiales. Demostraremos (11.20) para una 
región R del tipo I. Una tal región tiene la forma 

R = !(v, v) | a < x < b y f(x) < v < g(x )}, 

en donde / y g son continuas en [a, &] siendo / ^ g. La frontera C de R consta 
de cuatro partes, un arco inferior C t (gráfica de /), otro superior C 2 (gráfica de 
g), y dos segmentos rectilíneos verticales, recorridos en el sentido indicado en la 
figura 11.14. 
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Figura 11.14 Demostración del teorema de Figura 11.15 Demostración del teorema de 
Green para una región especial. Green para una región más general. 

Calculemos primero la integral doble — / / ( dP/dy) dx dy por integración 
sucesiva. Integrando primero respecto a y tenemos 



= P[x,Kx)] dx - f* P[x, g(x)] dx . 


Por otra parte, la integral de línea /c P dx puede escribirse así 
!c Pdx= !c 1 pdx+ ! Cî p . dx ' 

puesto que la integral de línea a lo largo de cada segmento vertical es cero. 
Para calcular la integral a lo largo de utilizamos la representación vectorial 
a(í) = ti +f(t)j y obtenemos 

J Ci Pdx = £' P[t,f(t)] dt. 

Para calcular la integral a lo largo de C 2 emplearemos la representación a(t) = 
ti + g(t)j y tendremos en cuenta la inversión del sentido para obtener 

S Ci pdx =-! b a p[t,g(t)idt. 

Tenemos por lo tanto 


S c p dx= /* P[t,f(t)] dt - P[t, g(í)] dt. 
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Comparando esta fórmula con la (11.21) obtenemos (11.20). 

Un razonamiento parecido puede emplearse para demostrar (11.19) para re- 
giones del tipo II. Se obtiene de este modo una demostración del teorema de 
Green para regiones que son a un tiempo del tipo I y del tipo II. Hecho esto, 
puede demostrarse el teorema para regiones R que pueden descomponerse en un 
número finito de regiones que son de ambos tipos. Se introducen «secciones» o 
«cortes» como se ve en la figura 11.15, se aplica el teorema a cada subregión, y 
se suman los resultados. Las integrales a lo largo de los cortes se reducen a pa- 
res, como se sugiere en la figura, y la suma de las integrales de línea a lo largo 
de las fronteras de las subregiones es igual a la integral de línea a lo largo de 
la frontera de R. 

11.20 Algunas aplicaciones del teorema de Green 

Los ejemplos que siguen muestran algunas aplicaciones del teorema de Green. 

ejemplo 1. Por medio del teorema de Green calcular el trabajo efectuado 
por el campo de fuerza f(x, y) = (y + 3 x)i + (2y — x)j al mover una partícula 
rodeando una vez la elipse 4x 2 + y 2 = 4 en el sentido contrario al de las agujas 
del reloj. 

Solución. E1 trabajo es igual f c P dx+Q dy, donde P=y+3x, Q = 2y—x, 
y C es la elipse. Ya que dQ/dx — dP/dy = — 2, el teorema de Green nos da 

J r P dx + Q dy = j j (-2) clx dy = -2 a(R ), 


donde a(R) es el área interior a la elipse. Ya que esta elipse tiene semiejes 
a = í y b = 2, su área es rrab = 2* y el valor de la integral de línea es —4?r. 

ejemplo 2. Calcular la integral / c (5 — xy — y 2 )dx — (2xy — x 2 )dy, donde 
C es el cuadrado de vértices (0, 0), (1, 0), (1, 1), (0, 1). 

Solución. Aquí P = 5 — xy — y 2 , Q = x 2 — 2xy, y dQ/dx — dP/dy = 3x. 
Luego, según el teorema de Green, tenemos, 

J P dx + Q dy = 3 j ( x dx dy = 3x, 

li 

donde x es la coordenada x del centroide del cuadrado. Puesto que x=\ f 2 , el 
valor de la integral de línea es %. 

ejemplo 3. El área expresada como una integral ae línea. La integrál do- 
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ble que da el área a(R) de una región R puede expresarse en la forma 

n r } 

en donde P y Q son tales que 3Q/3x — dP/dy = 1. Por ejemplo, podemos tomar 
Q(x, y) = Yzx y P(x, y) = — y. Si R es la región encerrada en una curva de 
Jordan C podemos aplicar el teorema de Green para expresar a(R) como integral 
de línea 


a(R) = í P dx + Q dy = - í — y dx + x dy. 

Jc 2 Jc 

Si la curva frontera C está dada paramétricamente 

x = X(t), y=Y(t), a <, t <, b, 

la integral de línea que da el área toma la forma 

1 p, , i c b \ m Y(*) I 

a(R) = % {-Y(t)X'(t) + X(t)Y'(t)} dt = i Uí. 

2 2ja\ X'(t) Y'(t) I 


11.21 Condición necesaria y suficiente para que un campo vectorial bi-dimen- 
sional sea un gradiente 


Sea f(x,y) = P(x, y)i + Q(x, v)j un campo vectorial derivable con conti- 
nuidad cn un conjunto abierto S deí plano. Si / es un gradiente en S tenemos 


3P = dQ 
dy dx 


en todo S. Es decir, la condición (11.22) es necesaria para que / sea un gra- 
diente. Como va hemos observado, esta condición no es suficiente. Por ejemplo, 

el campo vcctorial 


f(x, y) = 


•x 2 + y 2 x 2 + y 2 


satisface (11.22) en todo el conjunto S = R 2 — {(0, 0)}, pero / no es un gradiente 
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en S. En el teorema 10.9 se demostró que la condición (11.22) es a la vez nece- 
saria y suficiente para que / sea un gradiente en S si el conjunto S es convexo. 
Con la ayuda del teorema de Green podemos extender este resultado a una clase 
más general de conjuntos planos como los conjuntos simplemente conexos. Éstos 
se definen como sigue. 

DEFINICIÓN DE CONJUNTO PLANO SIMPLEMENTE CONEXO. Sea S UH COnjuntC 
plano abierto y conexo. Se dice que S es simplemente conexo si, para toda curva 
de Jordan C situada en S, la región interior a S es también un subconjunto de S. 

Un anillo (conjunto de puntos situados entre dos circunferencias concén- 
tricas) no es simplemente conexo debido a que toda la región interior a la cir- 
cunferencia externa no es un subconjunto del anillo. Dicho en forma intuitiva, un 
conjunto S es simplemente conexo cuando no tiene «agujeros». Otro modo de 
describir la conexión simple consiste en decir que una curva Cj de S que une 
dos puntos cualesquiera puede ser transformada sin ruptura en otra curva C 2 de S 
que une aquellos dos puntos, con la particularidad de que todas las curvas inter- 
medias obtenidas en la deformación están contenidas en S. Otra definición que 
es equivalente a la dada, según puede demostrarse, dice que un conjunto es sim- 
plemente conexo si su complementario (respecto a todo el plano) no es conexo. 
Por ejemplo, un anillo no es simplemente conexo porque su complemento es no 
conexo. Un conjunto abierto y conexo que no es simplemente conexo se llama 
múltiplemente conexo. 

teorema 11.11. Si f(x, y)=P(x,y)i+Q(x,y)j es un campo vectorial deri- 
vable con continuidad en un conjunto abierto simplemente conexo S del plano, 
entonces f es un gradiente en S si y sólo si tenemos 

(11.23) QL = en todos los puntos de S. 

• dy dx 

Demostración. Ya hemos dicho que la condición (11.23) es necesaria para 
que / sea un gradiente. Demostraremos ahora que también es sufìciente. 

Puede demostrarse que en cualquier conjunto plano conexo y abierto S, todo 
par de puntos a y x puede unirse mediante un polígono escalonado simple, esto 
es, mediante un polígono cuyos lados son paralelos a los ejes coordenados y que 
no se cortan a sí mismos. Si la integral de línea de / desde a hasta x tiene el 
mismo valor para todo polígono escalonado simple en S que una a con x, enton- 
ces el mismo razonamiento empleado para demostrar el teorema 10.4 prueba que 
/es un gradiente en S. Por consiguiente, necesitamos tan sólo comprobar que 
la integral de línea de / desde a hasta x tiene el mismo valor para todo polígono 
escalonado simple en S que una a con x. 

Sean Cj y C 2 dos polígonos escalonados simples en S que unan a y x. Algu- 
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Figura 11.16 Independencia del camino en una región simplemente conexo 


nas porciones de estos polígonos pueden coincidir. Las restantes porciones se cor- 
tarán a lo sumo un número finito de veces, y formarán las fronteras de un número 
finito de regiones poligonales, R lt ..., R m . Puesto que se supone que S es sim- 
plemente conexo, cada una de las regiones Rk es un subconjunto de S. En la figu- 
ra 11.16 se ha dibujado un ejemplo. La poligonal de trazo continuo representa C x 
y la de puntos C 2 , las regiones sombreadas son las R u ..., R m . (A lo largo del 
segmento pq esas dos poligonales coinciden.) 

Observemos ahora que la integral de línea de / a lo largo de C, desde a 
hasta x más la integral de x hasta a a lo largo de C 2 es cero ya que la integral 
a lo largo del camino cerrado es una suma de integrales tomadas sobre los seg- 
mentos comunes a Cj y C 2 más las integrales tomadas a lo largo de las fronteras 
de las regiones Ru- Las calculadas sobre los segmentos comunes se anulan a pares, 
ya que cada uno de tales segmentos se recorre dos veces, en sentidos opuestos, y 
su suma es cero. La integral sobre la frontera r* de cada región Rk también es 
cero porque, en virtud del teorema de Green, podemos escribir 

y el integrando de la integral doble es cero en virtud de la hipótesis dQjdx = dPjdy 
Se deduce que la integral de a a x a lo largo de C t es igual a la calculada a lo 
largo de C 2 . Como hemos observado antes, esto implica que / es un gradiente 
en S. 
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11.22 Ejercicios 


1. Usar el teorema de Green para calcular la integral f^y 2 dx + x dy cuando 

a) C es el cuadrado de vértices (0,0), (2,0), (2,2), (0,2). 

b) C es el cuadrado de vértices (± 1, ± 1). 

c) C es el cuadrado de vértices (± 2,0), (0, rrz 2). 

d) C es la circunferencia de radio2 y centro en el origen. 

e) C tiene la ecuación vectorial «(/) = 2 cos 3 ti + 2sen tj, 0 <, t <, 2n. 

2. Si P(x, y) = xe~ v * y Q(x,y) = -x 2 y e~ y ' + l/(x 2 + /) calcular la integralj^ Pdx+ 
Q dy siguiendo el contomo del cuadrado de lado 2 a deferminado por las desigualdades 

kl ^ a y lyl ^ 

3 . Sea C una curva cerrada simple del plano xy y representemos con J, el momento de 
inercia (alrededor del eje z) de la región interior a C. Demostrar que existe un entero n 
tal que 

nl z - ýçX^dy - ý dx. 

4. Dados dos campos escalares u y v derivables con continuidad en un conjunto abierto 
que contiene el disco R cuya frontera es la circunferencia x 1 + y 2 = 1. Definimos dos cam- 
pos vectoriales / y g como sigue: 


f(x, y) = v(x,y)i + u(x,y)j. 


/ Bu Bu\ / 3v 8v\ 

+ r,) J - 


Ençontrar el valor de la integral doble jjf gdxdy si se sabe que sobre la frontera 
de R se tiene u(x, y) = 1 y v(x, y) = y. n 

5. Si / y g son derivables con continuidad en un conjunto abierto conexo S del plano, 
demostrar que fVg ■ da = —jt^gVf datpsira toda curva de Jordan C regular a 
trozos contenida en S. 

6. Sean u y v dos campos escalares con derivadas parciales primeras y segundas con- 
tinuas en un conjunto abierto conexo S del plano. Sea R una región de S limitada por 
una curva de Jordan C regular a trozos. Demostrar que 



Derivadas normales. En la sección 10.7 definimos las integrales de línea respecto a la 
longitud del arco de tal modo que es válida la siguiente igualdad: 


\ c Pdx + Qdy=\ c f Tds, 
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donde / = Pi + Qj y T es el vector unitario tangente a C. (E1 producto interior f ■ T se 
llama componente tangencial de / a lo largo de C.) Si C es una curva de Jordan representada 
por una función derivable con continuidad a(/) = X(t)i + Y(t)j, el vector normal exterior 
unitario n a C se define por 

H(t) = (Y(t)i ~ x ' m 

donde ||a'(í)|| 0. Si <p es un campo escalar con un gradiente V <p en C, la derivada normal 

dcpjdn se define en C mediante la ecuación 



Esto es, naturalmente, la derivada direccional de <p en la dirección de n. En los ejercicios res- 
tantes de esta sección se tratan estos conceptos. 

7. Si / = Qi — Pj , demostrar que 

\ c Pdx +Qdy = \ c fnds. 

(E1 producto / • n se llama componente normal de / a lo largo de C.) 

8 . Sean / y g dos campos escalares con derivadas parciales segundas y primeras continuas 
en un conjunto abierto S del plano. Representemos con R una región (en S) cuya fron- 
tera es una curva de Jordan C regular a trozos. Demostrar las identidades siguientes, 
dondeV 2 « = B 2 uj Sx 2 + B 2 uj 3y 2 . 

R 

b) •£/- d £ds = JJ (fV 2 g + V/- Vg)dxdy. 

R 

c) i( 7 l) * - // v** 

R 

La identidad c) se llama fórmula de Green; ella demuestra que 

Ì/I* - i «ï is 

donde / y g son armónicas en R (esto es, cuando V 2 / = V 2 g = 0 en R). 

9. Supongamos que la ecuación diferencial 

P(x, y) dx + Q(x, ý) dy = 0 

tiene un factor integrante /i(x, y) que nos permite obtener una familia simplemente infinita 
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de soluciones de la forma <p(x, y) = C. Si la pendiente de la curva <p(x, y) = C en (x, y) 
es tan 0, el vector unitario normal n se expresa 

n = sen Oi — cos Oj. 


Existe un campo escalar g(x, y) tal que la derivada normal de <p viene dada por la fórmula 
= P(x,y)g(x,y), 

donde d<p/dn = Vy Hallar una fórmula explícita para g(x,y) en función de P(x, y) 
y Q(x,y). 


* 11.23 Teorema de Green para regiones múltiplemente conexas 

E1 teorema de Green puede generalizarse y ser aplicado a ciertas regiones 
múltiplemente conexas. 

TEOREMA 11.12. TEOREMA DE GREEN PARA REGIONES MÚLTIPLEMENTE CO- 
nexas. Sean C u ... ,C„ n curvas de Jordan regulares a trozos que tienen las 
propiedades siguientes: 

a) Dos cualesquiera de esas curvas no se cortan. 

b) Todas las curvas C 2 ,... ,C„ están situadas en el interior de C t . 

c) La curva C,- está en el interior de la curva Cj para cada i * j, i > 1, j > 1. 
Designemos con R la región que consiste en la reunión de C t con la porción del 
interior de C t que no está dentro de cualquiera de las curvas C 2 , C 3 ,..., C„. 
(En la figura 11.17 está representada una de tales regiones.) Sean P y Q derivables 
con continuidad en un conjunto abierto S que contiene R. Tenemos entonces la 
siguiente identidad: 

(11.24) JJ dx dy =j* c (Pdx + Q dy ) jjP dx + Q dy ). 

E1 teorema puede demostrarse introduciendo cortes que transformen R en 
una reunión de un número fìnito de regiones simplemente conexas bordeadas por 
curvas de Jordan. E1 teorema de Green se aplica separadamente a cada una de las 
partes, y se suman luego los resultados. Comentaremos el caso n = 2. Por induc- 
ción se demuestra para un número n cualquiera de curvas. 

La idea de la demostración cuando n = 2 se ilustra con el ejemplo de la figura 
11.18, donde C, y C 2 son dos circunferencias, siendo C, la mayor. Practicamos los 
cortes AB y CD, como se ve en la figura. Sea K, la curva de Jordan consistente en 
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las mitades superiores de C, y C 2 , y los dos segmentos AB y CD. Llamemos K 2 
otra curva de Jordan formada por las mitades inferiores de C a y C 2 , y los dos 
segmentos AB y CD. Aplicamos el teorema de Green a cada una de las regiones 
limitadas por K x y K 2 y sumamos las dos identidades así obtenidas. En la suma 
las integrales calcUladas a lo largo de los cortes se anulan unas con otras (pues 
cada corte es recorrido una vez en cada dirección), y se obtiene 

JJ dxdy=j>JtPdx + Qdy)-j>JÍPdx + Qdy). 

E1 signo menos aparece debido a Ia dirección con que se recorre C 2 . Esta es la 
ecuación (11.24) cuando n = 2. 

Para una región simplemente conexa, la condición dP/dy —dQ/dx implica que 
la integral de línea f P dx + Q dy es independiente del camino (teorema 11.11). 
Como ya hemos observado, si S no es simplemente conexo, la condición dP/dy = 
= dQ/dx no implica necesariamente la independencia del camino. No obstante, 
para este caso existe una condición de independencia que se deduce del teore- 
ma 11.12. 

TEOREMA 11.13. INVARIANCIA DE UNA INTEGRAL DE LÍNEA AL DEFORMAR EL 
camino. Sean P y Q derivables con continuidad en un conjunto abierto conexoS 
del plano, y supongamos que dP/dy = dQ/dx en todo S. Sean C, y C 2 dos cur- 
vas de Jordan regulares a trozos situadas en S y que satisfagan las siguientes con- 
diciones: 

a) C 2 está en el interior de C,. 


El número de giros 


475 


b) Los puntos interiores a C x que son exteriores a C 2 pertenecen a S. (En la 
figura 11.19 se ve un ejemplo.) Tenemos entonces 

( h - 25 ) j Cl pdx + Q d y = § Cì Pdx + Qdy ’ 

recorriéndose ambas curvas en el mismo sentido. 

Demostración. En las condiciones establecidas.la ecuación (11.24) es aplica 
ble cuando n — 2. La región R está constituida por los puntos situados entre las 
dos curvas Cj y C 2 y las propias curvas. Puesto que dP/dy = 'àQ/dx en S, el pri- 
mer miembro de (11.24) es cero y obtenemos (11.25). 

Algunas veces el teorema 11.13 se expresa diciendo que si dP/dy = dQ/dx 



Figura 11.19 Invariancia de una intezral de línea al deformar el camino. 


en S el valor de una integral de línea a lo largo de una curva cerrada simple en 
S no varía si el camino se cambia por deformación en otra curva cerrada simple 
cualquiera de S, con tal que todas las curvas intermedias que se van obteniendo 
en la deformación permanezcan dentro de S. Se supone que el conjunto S es 
conexo y abierto — no es preciso que sea simplemente conexo. 

* 11.24 E1 número de giros 

Hemos visto que el valor de una integral de línea depende frecuentemente a 
la vez de la curva a lo largo de la cual se integra y del sentido en el que dicha 
curva se recorre. Por ejemplo, la identidad del teorema de Green exige que la 
integral se tome en el sentido contrario al de las agujas del reloj. En un estudio ri- 
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guroso del teorema de Green sería necesarío describir analíticamente lo que 
significa recorrer una curva cerrada en el sentido «contrario al de las agujas 
del reloj». Para ciertas curvas puede hacerse esto estableciendo convenios particu- 
lares relativos a la función vectorial a que describe la curva. Por ejemplo, la 
función vectorial ot definida en el intervalo [0, 2n] por la ecuación 

(11.26) <*(t) = (a cos t + x 0 )i + (asen t + y 0 )j 

describe una circunferencia de radio a y centro en y 0 ). Se dice que esta fun- 
ción describe la circunferencia en sentido positivo o contrario al de las agujas 
del reloj. Por otra parte, si reemplazamos t por —t en el segundo miembro de 
(11.26) obtenemos una nueva función de la que se dice que describe la circun- 
ferencia en sentido negativo o de las agujas del reloj. De este modo hemos dado 
una descripción completamente analítica del sentido para una circunferencia. 
Sin embargo, no es tan sencillo hacer lo mismo con una curva cerrada cual- 
quiera. Para curvas regulares a trozos puede hacerse introduciendo el concepto 
del número de giros, un instrumento analítico que nos da un método matemá- 
ticamente preciso para contar el número de veces que el radio vectOr a «gira alre- 
dedor» de un punto dado cuando va describiendo una curva cerrada dada. En 
esta sección describiremos brevemente un método para introducir el número de 
giros. Luego indicaremos cómo puede usarse para asignar sentidos positivos y 
negativos a las curvas cerradas. 

Sea C una curva cerrada del plano regular a trozos, descrita por una fun- 
ción vectorial a definida en un intervalo [a, b], por ejemplo 

a(í) = X(t)i + Y(t)j si a<,t<,b. 

Sea P 0 = (xo, yo) un punto no situado en la curva C. E1 número de giros de a 
con respecto al punto P 0 se designa por W(a; P 0 ); se define como el valor de Is 
siguiente integral 

(11 27) W(a- P„) = — í b [^(0 ~ x o] y '(0 ~ im — y 0 \X'(t) 

iJa [2T(0 - x 0 ] 2 + [y(í) - y 0 f dt - 

Esto es lo mismo que la integral de línea 

(11.28) — <£ — yo) dx + ( x ~ x 0 ) dy 

2i t Jc (x - x 0 ) 2 + (y - y 0 ) 2 

Puede demostrarse que el valor de esta integral siempre es un entero, positivo, 
negativo o nulo. Además, si C es una curva de Jordan (curva cerrada simple) ese 
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entero es 0 si P„ es exterior a C y vale +1 ó — 1 si P„ es interior a C. (Ver 
figura 11.20.) Asimismo, W(a; P„) es +1 ó -1 para todo punto P n interior a C. 



Número de giros +1 Número de giros — 1 Número de giros 0 

Figura 11.20 Posibles valores del número de giros de una curva de Jordan C 
con respecto al punto Po. 


Esto nos permite deftnir las orientaciones positiva y negativa para C del siguiente 
modo: Si el número de giros W(a; P n ) es +1 para todo punto P„ interior a C 
decimos que a describe C en sentido positivo o contrario al de las agujas del 
reloj. Si el número de giros es — 1 decimos que a describe C en sentido negativo 
o de las agujas del reloj. [En el ejemplo 2 de la sección 10.16, ya se vio un 
ejemplo de la integral (11.28).] 

Para probar que la integral que da el número de giros es siempre +1 ó — 1 
para una curva cerrada simple alrededor de (x 0 , y 0 ), utilizamos el teorema 11.13. 
Designemos con S la región conexa abierta constituida por todos los puntos del 
plano excepto (x 0 , y 0 ). La integral de línea (11.28) puede entonces escribirse en 
la forma $ c Pdx + Qdy, y se comprueba fácilmente que dP/dy = dQ/dx en toda 
la región S. Por consiguiente, si (x 0 ,y 0 ) es interior a C, el teorema 11.13 nos dice 
que podemos reemplazar la curva C por una circunferencia con centro en (x 0 , y 0 ) 
sin que cambie el valor de la integral. Comprobamos seguidamente que para una 
circunferencia la integral que da el número de giros es +1 ó — 1, según que la 
circunferencia esté orientada positiva o negativamente. Para una circunferencia 
orientada positivamente podemos utilizar la representación de la ecuación (11.26). 
En tal caso tenemos 

X(t) = a cos t + x 0 , Y(t) = asent + y 0 , 

■ y el integrando de (11.27) es idénticamente igual a 1. Por tanto obtenemos 

W(a;P 0 ) = ^ j \dt = 1. 

Mediante un razonamiento análogo encontramos que la integral es — 1 cuando C 
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está orientada negativamente. Esto demuestra que el número de giros es +1 ó 
— 1 para una curva cerrada simple que incluye en su interior el punto (x (ì , y,,). 

* 11.25 Ejercicios 

1. Sean S = í(*,_y)|* 2 +/>0},y 

ríx ’^-^Tf' &*■>’>-TTf 

si (x,y) e S. Sea C una curva de Jordan regular a trozos contenida en S. 

a) Si (0,0) es interior a C, demostrar que la integral de línea l c Pdx + Q dy toma el 
valor ± 2ir, y razonar cuando el signo es más. 

b) Calcular el valor de la integral S c Pdx + Q dy cuando (0,0) es exterior a C. 

2. Si r = xi + yj y r = ||r|| , sea 


para r>0. Sea C una curva de Jordan regular a trozos situada en el anillo l<x ! +y J <25. 
Hallar todos los valores posibles de la integral de línea de / a lo largo de C. 

3. Una región plana conexa con un solo «agujero» se llama doblemente conexa. (E1 anillo 
1 < x 2 + ý < 2 es un ejemplo.) Si P y Q son derivables con continuidad en una región 
abierta R doblemente conexa, y si dP/By = dQ/dx en todo R. iCuántos valores distintos 
posibles existen para las integrales j c P dx + Q dy tomadas sobre curvas de Jordan regu- 
lares a trozos situadas en R1 




Figura 11.21 Ejercicìo 5 


Figura 11.22 Ejercicio 6 
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4. Resolver el ejercicio 3 para regiones triplemente conexas, esto es, para regiones planas 
con dos agujeros solamente. 

5. Sean P y Q dos campos escalares con derivadas continuas que satisfacen dPj dy = dQ/dx 
en todo el plano excepto en tres puntos. Sean C u C 2 , C 3 tres círculos, como muestra la 

figura 11.21, y sea h=-j) P dx + Q dy. Supongamos que U = 12, h = 10, h = 15. 

a) Hallar el valor de 5 a P dx + Q dy, siendo C la curva en forma de ocho. 

b) Dibujar otra curva cerrada r a lo largo de la cual SPdx + Qdy = 1. Indicar en 
el dibujo el sentido en el que se recorre el camino. 

c) Si h = 12, h = 9, e h = 15, demostrar que no existe camino cerrado alguno r 
a ld largo del cual / P dx + Q dy = 1. 

6. Sea h = Pdx + Q dy, donde 

°* r x r 1 1 ii 

P(x ' y) = ~ y l(x - l) 2 +/ + TTf + (X + 1)® +/J 
y 

X — 1 X X + 1 

Q(x,y) = (* -D* +/ + ^Tf + (x + D 8 +f ' 

En la figura 11.22, Ci es la circunferencia menor, x 1 + y 2 = i (con el sentido contrario al 
de las agujas del reloj), C 2 es la circunferencia mayor, x 1 + y 1 = 4 (sentido contrario 
al de las agujas del reloj), y C, es la curva reunión de las tres circunferencias 
(x _ i)2 + yì = x 2 + yì = y (x + l) 2 +y* = i dibujadas en los sentidos que se 
indican en la figurà. Si h = 6ir e I, = 2 ir, hallar el valor de h. 


11.26 Cambio de variables en una integral doble 

En la teoría de integración unidimensional el método de sustitución nos 
permite calcular integrales complicadas transformándolas en otras más sencillas 
o en tipos que pueden calcularse más fácilmente. E1 método se basa en la fórmula 

(11.29) / o V(x) dx = j* f[g(t)]g’(t) dt, 

donde a = g(c) y b = g(d). En el volumen I se demostró esta fórmula suponiendo 
que g tiene derivadas continuas en [c, d] y que / es continua en el conjunto de 
valores que toma g(t) al variar t en el intervalo [c, d]. 

En dos dimensiones existe análogo problema para las integrales dobles. Se 

transforma una integral doble de la forma J7 f(x, y) dx dy, extendida a una 

s 

región S en el plano xy, en otra integral doble JJ F(u, v) du dv, extendida a una 

T 

nueva región T del plano uv. Vamos a estudiar a continuación la relación entre 
las regiones S y T y los integrandos f(x, y) y F(u, v). E1 método de sustitución 
en integrales dobles es más laborioso que en las simples debido a que existen dos 
sustituciones formales a efectuar, una respecto a x y otra respecto a y. Esto signi- 
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fica que en lugar de una función g que aparece en (11.29), tenemos ahora dos 
funciones, X e Y, que relacionan x, y con u, v del modo siguiente: 

(11.30) x = X(u,v), y = Y(u,v). 

Geométricamente, puede considerarse que las dos ecuaciones (11.30) definen 
una «aplicación» que hace corresponder a un punto (u, v) del plano uv, el punto 
imagen (x, y) del plano xy. Un conjunto T de puntos del plano uv es aplicado en 
otro conjunto S del xy, como se representa en la figura 11.23. La aplicación tam- 
bién puede expresarse mediante una función vectorial. En el plano xy trazamos 
el radio vector r que une el origen con un punto genérico (x, y) de S (véase figu- 
ra 11.23). E1 vector r depende de u y v y puede considerarse como una función 
vectorial de dos variables defiiiída por la ecuación 

(U-31) r(u, v) = X(u, v)i + Y(u, v)j si (u, v) e T. 

Esta ecuación se llama la ecuación vectorial de la aplicación. Como (u, v) recorre 
puntos de T, el vértice de r (u, v) describe puntos de S. 

Algunas veces las dos ecuaciones (11.30) pueden resolverse despejando 
u y. v en función de r e y. Cuando ello es posible podemos expresar el resultado 
en la forma 


u=U(x,y), v=V(x,y). 

Estas ecuaciones definen una aplicación del plano xy en el plano uv, llamada 
aplicación inversa de la definida por (11.30), ya que transforma los puntos de S 
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en los de T. Las llamadas aplicaciones uno a uno son de especial importancia. 
Esas transforman puntos distintos de T en puntos distintos de S; dicho de otro 
modo, dos puntos distintos de T no se aplican en el mismo punto de S mediante 
una aplicación uno a uno. Tales aplicaciones establecen una correspondencia 
uno a uno entre los puntos de T y los correspondientes de S y nos permite (por 
lo menos teóricamente) regresar de S a T por la aplicación inversa (que, natu- 
ralmente, es también uno a uno). 

Consideraremos aplicaciones para las que las funciones X e Y son continuas 
y tienen derivadas parciales continuas dX/du, dXjdv,d Yjdu y d Y/dv en S. Para las 
funciones V y V se hacen análogas hipótesis. Esas restricciones no son en realidad 
muy rigurosas pues las cumplen la mayoría de las funciones que surgen en la 
práctica. 

La fórmula para la transformación de integrales dobles puede escribirse así: 


(11.32) /J7(x, y) dx dy = jj f[X(u, v), Y(u, v)]\J(u, »)| du dv. 


E1 factor J(u, v) que aparece en el integrando del segundo miembro desempena 
el papel del factor g'(t) de la fórmula (11.29). Este factor se llama jacobiano de 
la aplicación definida por (11.30); es igual al determinante 


dX dY 


J(u, v) = 


du du 
dX 3Y 
dv dv 


Algunas veces se usa el símbolo 3(X, Y)/d(u, v) en lugar de /(«, v) para repre- 
sentar el jacobiano. 

No discutiremos las condiciones más generales en las que es válida la fór- 
mula (11.32). Puede demostrarse (*) que (11.32) es válida si, además de la con- 
tinuidad de X, Y, U y V antes mencionada, suponemos que la aplicación de T 
en S es uno a uno y que el jacobiano J(u, v) es distinto de cero. La fórmula tam- 
bién es válida aunque la aplicación no sea uno a uno en un subconjunto de 
medida nula o el Jacobiano se anule en un conjunto de esta clase. 

En la sección 11.30 demostraremos como la fórmula de transformación 
(11.32) puede deducirse de uno de sus casos particulares, a saber, el caso en 
que S es un rectángulo y la función / tiene el valor constante 1 en cada punto 
de S. En este caso particular se transforma en 


(11.33) 


JJ dx dy = JJ |J(w, u)| du dv. 


(*) Véase el teorema 10-30 del Análisis matemático del 
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Aún en este caso la demostración no es sencilla. En la sección (11.29) se dará 
una demostración de (11.33) con el auxilio del teorema de Green. En lo que 
resta de esta sección presentaremos un razonamiento puramente geométrico que 
justifica la validez de (11.33). 

Interpretación geométrica de la ecuación (11.33): Tomemos una región T 
en el plano uv, como se representa en la figura 11.23, y sea S el conjunto de 
puntos del plano xy en Ios que T es aplicado por la función vectorial r dada por 
(11.31). Introducimos ahora dos nuevas funciones vectoriales V t y V 2 que se 
obtienen tomando las derivadas parciales de los componentes de r con respecto 
a u y v, respectivamente. Esto es, definimos 





Figura 11.24 Una curva u y el correspondiente vector velocidad. 

Estos vectores pueden interpretarse geométricamente como sigue: Considere- 
mos un segmento rectilíneo horizontal en el plano uv (sobre dicho segmento v es 
constante). La función vectorial r aplica este segmento sobre una curva (llamada 
curva u) en el plano xy, como se indica en la fìgura 11.24. Si consideramos u 
como un parámetro representando «tiempo», el vector V Y representa la velocidad 
de la posición r y es por lo tanto tangente a la curva descrita por el extremo 
de r. Del mismo modo, cada vector V 2 representa el vector velocidad de una 
curva v obtenida haciendo u — constante. Una curva u y una curva v pasan por 
cada punto de la región S. 

Consideremos ahora un pequeno rectángulo de dimensiones A u y Av, como 
se presenta en la figura 11.25. Si A u es la longitud de un pequeno intervalo de 
tiempo, un punto de una curva u se desplaza, en el tiempo A u, a lo largo de la 
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Figura 11..25 La imagen de una región rectangular del plano uv es un paralelogramo 
curvilíneo en el plano xy. 

misma una distancifl aproximadamente igual al producto||F 1 || Au (ya queHFJre- 
presenta la velocidad y A u el tiempo). Análogamente, en el tiempo Av un punto 
de una curva v se desplaza a lo largo de ella una distancia aproximadamente 
igual a |t V 2 \\ Av. Por consiguiente, la región rectangular de dimensiones Aw y Av 
del plano uv se transforma en una porción del plano xy que es casi un parale- 
logramo, cuyos lados son ios vectores A u y V 2 Av como se ve en la figura 11.25. 
E1 área de ese paralelogramo es el valor del producto exterior de los dos vec- 
tores Fj A u y V 2 Av; éste es igual a 

||(F x Am) x (V 2 Av)|| = ||x V 2 \\ AuAv. 

Si calculamos el producto V x x V 2 en función de los componentes de V x y V 2 
encontramos 


1 

j 

k 


dx 

dY 

dX 

BY 

0 


du 

du 

du 

du 


= 

dX 

8Y 

dX 

BY 

0 


dv 

dv 

dv 

dv 





Luego la magnitud de V x x V 2 es exactamente J(u, v) y el área del paralelo- 
gramo curvilíneo de la figura 11.25 es casi igual a J(u, v) AuAv. 

Si J(u, v) = 1 para todos los puntos de T, el «paralelogramo» tiene la misma 
área que el rectángulo y la aplicación conserva las áreas. Si no es así, para obtener 
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el área del paralelogramo debemos multiplicar el área del rectángulo por [/(«, v)|. 
Esto sugiere que el jacobiano puede imaginarse como un «factor de ampliación» 
de áreas. 

Sea ahora P una partición de un rectángulo R que contenga toda la región T 
y consideremos un rectángulo parcial de P de dimensiones Au y Av. Si Au y 
Av son pequenos, la función / es casi constante en el rectángulo parcial y por lo 
tanto / actúa prácticamente como una función escalonada en R. (Asignamos a 
/ el valor cero en el exterior de T.) Si consideramos / como una auténtica función 
escalonada, entonces la integral doble de |/| sobre R (y por tanto sobre T) es 
una suma de productos de la forma |/(u, v)| Au Av ý las anteriores consideracio- 
nes sugieren que esta suma es aproximadamente igual al área de S, que conoce- 
mos como la integral doble /f dx dy. 

Esta discusión geométrica, que tan sólo sugiere por qué puede esperarse la 
validez de una fórmula como la (11.33), puede constituir la base de una demos- 
tración rigurosa, pero los detalles son largos e intrincados. Como antes se ha 
dicho, se dará en un capítulo posterior una demostración de (11.33) con funda- 
mento totalmente distinto. 

Si /(«. v) = 0 en un punto (u, v), los dos vectores V x y V 2 son paralelos (ya 
que su producto exterior es el vector nulo) y el paralelogramo degenera. Tales 
puntos se Uaman puntos singulares de la aplicación. Como ya hemos mencionado, 
la fórmula de transformación (11.32) también es válida con tal que exista un 
número finito de puntos singulares o, más general, cuando tales puntos formen 
un conjunto de medida nula. Esto es lo que ocurre en todas las aplicaciones que 
usaremos. En la sección siguiente empleamos la fórmula (11.32) en dos ejemplos 
importantes. 


11.27 Casos particulares de la fórmula de transformación 


ejemplo 1 . Coordenadas polares. En este caso escribimos r y 0 en lu<^ 
de u y v y defmimos la aplicación con las ecuaciones 


x 


r cos 6 , 


y 


rsenâ. 


Esto es, X(r, 0) — r cos 0 e Y(r, 0) = r sen 0. Para conseguir una aplicación uno 
a uno mantenemos r > 0 y 0 en un intervalo de la forma 0 O ^ 0 < 0 O + 2-tt. Por 
ejemplo, la aphcación es uno a uno en cualquier subconjunto del rectángulo 
(0, a ] X [0, 2tt) del plano rO. E1 jacobiano de esta aplicación es: 


'dX 

dY 

dr 

dr 

dX 

dY 

dd 

dd \ 


cos 6 sen 6 
—rsend rcosd 


r( cos 2 6 + sen 2 6) = r. 
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Luego la fórmula de transformación (11.32) toma la forma 

JJ f{x, ý) dx dy = JJ/(r cos 6, r sen 0) r dr dd. 


Las curvas r son rectas por el origen y las curvas 9 son círculos concéntricos con 
el origen. La imagen de un rectángulo en el plano rd es un «paralelogramo» en el 
xy limitado por dos radios y dos arcos de círculo, como se ve en la fìgura 11.26. 



Figura 11.26 Transformación por coordenadas polares. 

E1 jacobiano se anula cuando r = 0, pero esto no afecta la validez de la fórmula 
de transformación porque el conjunto de puntos con r = 0 tiene contenido o 
medida nula. 

Puesto que V x — cos 6 i + sen 6 j, tenemos ||FJ = 1, así que no existe dis- 
torsión de distancias a lo largo de las curvas r. Por otra parte, 

F 2 = — rsenOi + r cos 6j, ||F 2 ||=r, 

de modo que las distancias a lo largo de las curvas 9 quedan multiplicadas por 
el factor r. 

Las coordenadas polares son particularmente convenientes cuando la región 
de integración tiene fronteras a lo largo de las cuales r o 9 es constante. Por ejem- 
plo, consideremos la integral para calcular el volumen de un octante de esfera de 
radio a. 


J J Va 2 — x 2 — y 2 dx dy, 
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en la que la región S es el primer cuadrante del disco circular x 2 + y 2 < a 2 . 
En polares la integral se transforma así 

J/ y/a 2 — r 2 rdrdd, 

T 

donde la región de integración T es ahora un rectángulo [0, a] X [0, $■*] ■ Inte- 
grando primero respecto a 6 y luego respecto a r obtenemos: 



Éste es el mismo resultado que se obtuvo antes, pero en polares resulta el cálculo 
más cómodo y breve. 

ejemplo 2. Transformaciones lineales. Una transformación lineal es una 
aplicación definida por un par de ecuaciones de la forma 

(11.34) x = Au + Bv, y = Cu + Dv, 

donde A, B, C, D son constantes dadas. E1 jacobiano es: 

J(u, v) = AD — BC, 

V para asegurar la existencia de la transformación inversa suponemos AD—BC¥= 0. 
Esto nos garantiza que podamos resolver las ecuaciones lineales (11.34) respecto a 
u y v en función de x e y. 

Las transformaciones lineales transforman rectas en rectas. Por lo tanto, la 
imagen de un rectángulo en el plano uv es un cuadrilátero en el xy, y su área es 
la del rectángulo multiplicada por el factor |/(«,v)| = \AD - BC\. La fórmula 
de transformación (11.32) se convierte en esta otra 

JJ/(*. y) dx dy = \AD — BC\ JJ f(Au + Bv, Cu + Dv) du dv. 

A continuación damos un ejemplo en el que se pone de manifiesto la utilidad 
de un cambio lineal de variable. Consideremos la integral 

JJ e (v ~ xì/lv+x) dx dy, 

s 

en la que S es el triángulo determinado por la recta x + y = 2 y los dos ejes 
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coordenados. (Véase figura 11.27.) La presencia de y - x e y + * en el integrando 
sugiere el cambio de variable 

u—y — x, v =y + x. 

Resolviendo respecto a x e y encontramos 



E1 jacobiano es /(«, v) =-|. Para encontrar la imagen T de S en el plano uv 
observemos que las rectas x = 0ey = 0se transforman en las rectas u = v y 
u = -v, respectivamente; la recta x + y = 2 se transforma en la recta v = 2. 
Los puntos interiores a S satisfacen 0<x + y<2yse transforman en puntos 
de T que satisfacen 0 < v < 2. Por lo tanto, la nueva región de integración T 
es una región triangular, como se ve en la fìgura 11.27. La integral doble que 
consideramos se transforma así 


JJ e iv x)/(v+x) dx dy = - JJ e u,v du dv. 

S ^ T 

Integrando primero respecto a u encontramos 

ì /i dudv -\ ni : e """“] dc 
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11.28 Ejercicios 


En c a da un ° de los ejercicios del 1 al 5, dibujar la región S y expresar la integral doble 
ij l( x « y) dx dy como una integral reiterada en coordenadas polares. 

1. S = {(x,y) | jc a +/^ a 2 }, donde «>0. 

2. S = {(jc, y) \x 2 +y 2 <, 2x}. 

3- S = {(x,y)\a 2 £x 2 +y 2 <,b 2 }, donde 0 <a<b. 

4. S = {(x,y) |0 <.y <, 1 -jc,0 £ 1). 

5. S = {(x.j) | x 2 <,y <, 1, -1 ^ l). 

En los ejercicios del 6 al 9, transformar la integral a coordenadas polares y calcular su 
valor.fLa letra a representa una constante positiva.) 

6 ' /:U 20 * * ( x * +f) d ŷ\ dx - 8. JJ [['(*• +f)-'xídy\ dx. 

7 - JÏUN* + f d y\ dx - 9 . +y 2 )dx\ dy. 

En los ejercicios del 10 al 13, transformar cada una de las integrales dadas en una o más 
integrales reiteradas en polares. 

10 - /:[/: f^y) d y\ dx - 12. \l\i^~ xt fOc,y) d y\ dx - 

n - /:[/: 3/( ^ 2 + y 2 ) d y\ dx • 13 . \l\jl'f( x >y) d y\ dx - 

14. Utilizar una conveniente transformación lineal para calcular la integral doble 

ff( x ~ y) 2 ser, 2 (x +y)dxdy 

S 

donde S es el paralelogramo con vértices (ir, 0), (2w, n), (n, 2n), (0, n). 

15. Los^ v^értices de un paralelogramo S del plano xy son los puntos (0,0), (2,10), (3,17) 

a) HaIlar una transformación Hneal u = ax + by, v'= cx + dy, que aplique S en un 
rectangulo R del plano uv con vértices opuestos en (0,0) y (4,2). E1 vértice (2 10) de- 
bera aplicarse en un punto del eje u. 

b) Calcular la integral doble JJ xy dx dy transformándola en una integral equivalente en 

s 

el rectángulo R del apartado á). 

16 Si r > 0, pongamos I(r)= \ r _ T e~ u ' du. 

a) Demostrar que P(r)= jj e ~’ix’+ tl *)dxdy, en donde R es el cuadrado R=[-r,r)x[~r, r). 

b) Si Ci y C; son los discos circuiares inscrito y circunscrito a R, demostrar que 


jj e (as’+v*) dx dy < I 2 (r) < JJ «.-<**+»*) dxdy. 
Ci oi 
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c) Expresar las integrales a lo largo de C, y C 2 en coordenadas polares y apliçar b) para 
deducir que I(r) -*■ Vïr cuando r -> Esto demuestra gue Jf“ e““ 2 du = \fnj2. 

d) Aplicar el apartado c) para deducir que E(^) = f n, siendo T la función gamma. 

17. Considerar la aplicación definida por las ecuaciones 


x 


v, y = v — u 2 . 


a) Calcular el jacobiano /(n, v). 

b) Un triángulo T en el plano uv tiene vértices (0,0), (2,0), (0,2). Representar, mediante 
un dibujc, la imagen S en el plano xy. 

c) Calcular el área de S mediante una integral doble extendida a S y también mediante 
otra integral doble extendida a T. 

d) Calcular J J (x — y + l) -2 dx dy. 

18. Considerar la aplicación definida por Ias dos ecuaciones x = u 2 — v 2 , y = 2uv. 

a) Calcular el jacobiano J(u,v). 

b) Sea T el rectángulo en el plano uv con vértices (1,1), (2,1), (2,3), (1,3). Represen- 
tar, mediante un dibujo, la imagen S en el plano xy. 

c) Calcular la integral doble SSxydxdy^hacicndo el cambio de variable x = ti — v 2 , 

y = 2uv, donde C = {(x,_y) | x 2 + y 1 <, 1} . 

19. Calcular Ia integral doble 


de 

20 . 

21 . 

22 . 


I{p, r) 


// 


R 


dxdy 

(p 2 + x 2 + f) v 


sobre el disco circular R = {(x,_y) \ x 2 + y 2 <L r 2 }. Determinar los valores de p para 
los que I(p,r) tiene límite cuando r—* + «. 


En los ejercicios 20 al 22, establecer las igualdades que se dan mediante la introducción 
un conveniente cambio de variable en cada caso. 


|| f(x + y)dxdy = |^ f(u) du , donde S = {(*,_>') | + |_y| <, 1}. 


|| f(ax + by + c)dxdy = 2 1^ fl — u 2 f(uyja 2 + + c)du, 

donde S = {(x, y) [ x 2 + y 2 ^ 1} y a 2 + b 2 7*0. 

|| f(xý) dx dy = log 2 |^ f(u) du, siendo S la región del primer cuadrante limitada por 
las curvas xy = 1 , xy = 2,y = x,y = Ax. 



490 Integrales múltiples 

11.29 Demostración de la fórmula de transformación en un caso particular 


Como ya se ha indicado antes, la fórmula de transformación 

(11.35) JJ/(x, y) dx dy = jf f[X(u, v), Y(u, u)] \J(u, »)| du dv 

S T 

puede deducirse como una consecuencia del caso particular en el que S es un 
rectángulo y / es idénticamente igual a 1. En este caso la fórmula se simplifica, 
reduciéndose a 

(11.36) jjdxdy = jj\J(u,v)\dudv. 

R fi* 

Aquí R representa un rectángulo en el plano xy y R* representa su imagen en 
el plano uv (véase figura 11.28) obtenida con una aplicación uno a uno 

u = U(x,ý), v = V(x,y). 

La aplicación inversa viene dada por 

x = X(u,v), y=Y(u,v), 



.28 Ley de transformación para integrales dobles deducida del teorema de Greet 
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y f(u, v) es el determinante jacobiano 


dX 

BX 

du 

dv 

8Y 

dY 

du 

dv 


En esta sección utilizamos el teorema de Green para demostrar (11.36), y 
en la siguiente deducimos la fórmula más general (11.35) a partir del caso par- 
ticular (11.36). 

Para la demostración suponemos que Ias funciones X e Y tienen derivadas 
parciales segundas continuas y que el jacobiano nunca se anula en R*. Enton- 
ces J(u, v) es siempre positivo o siempre negativo. E1 signifìcado de este signo 
de J(u, v) es que cuando un punto (x, y) describe la frontera de R en el sentido 
contrario al de las agujas del reloj, el punto imagen (u, v) describe la frontera 
de R* en el mismo sentido si J(u, v) es positivo y en sentido contrario si J(u, v) 
es negativo. En la demostración supondremos que J(u, v) > 0. 

La idea de la demostración es la de expresar cada integral doble de (11.36) 
como una integral de línea usando el teorema de Green. Comprobamos luego la 
igualdad de las dos integrales de línea expresándolas en forma paramétrica. 
Comenzamos con la integral doble en el plano xy, escribiendo 

//**“//(?-$**• 

en donde Q(x, y) = x y P(x, y) = 0. Según el teorema de Green esta integral 
doble es igual a la integral de línea 

(11-37) J c P dx + Q dy = f c x dy. 

Aquí C es la frontera de R recorrida en el sentido contrario al de las agujas del 
reloj. 

Análogamente, transformamos la integral doble en el plano uv en una inte- 
gral de línea a lo largo de la frontera C* de R*. E1 integrando, J(u, v), puede 
escribirse como sigûe: 

j(m v ) = ^E1L _ d A d _l = d Jí d _l + X — x g2y dxdY 

du dv dv du du dv du dv dv du dv du 
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Aplicando el teorema de Green a la integral doble sobre R* encontramos 

| f J(u, v) du dv = f (x — du + X — dv) . 

Jc* \ du dv / 

Por consiguiente, para completar la demostración de (11.36) necesitamos 
tan sólo comprobar que 

Jc Jc -* \ ou dv ) 

Introducimos una parametrización de C* y utilizamos ésta para hallar una 
representación de C. Supongamos que C* está descrita por una función a defînida 
en un intervalo [a, 6], por ejemplo 

a(í) = U(t)i + V(t)j. 

Llamemos 

P(0 = X[U(t), V(t)]i + Y[U(t), V(t)]j. 

Entonces cuando t varía en el intervalo [ a , &], el vectora(f) describe la curva C* 
yP (í) la C. Según la regla de la cadena, la derivada de p viene dada por 

, ( , ) = g, ( , ) + |Ho] l+ g,v) + |n„], 

Luego 

\ c xd y = no](^ u\t) + g Kxo) dt. 


La última integral sobre [a, b] se obtiene también parametrizando la integral de 
línea sobre C* en (11.37). Por consiguiente las dos integrales de línea (11.37) 
son iguales, lo que demuestra (11.36). 

11.30 Demostración de la fórmula de transformación en el caso general 

En esta sección deducimos la fórmula general de transformación 


(11.38) 


JJ f(x, y) dx dy = JJ f[X(u, v), Y(u, «)] \J(u, d)| du dv 
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a partir del caso particular tratado en la sección anterior, 

(11.39) JJ dx dy = JJ | J(u, u)| du dv, 

R R* 

en donde R es un rectángulo y R* su imagen en el plano uv. 

Demostramos ante todo que 

(11.40) JJ s(x, y) dx dy = JJ s[X(u, v), Y(u, p)] \ J(u, ij)| du dv, 

r R* 

siendo s una función escalonada cualquiera definida en R. A tal fin, sean P una 
partición de R en mn subrectángulos de dimensiones Ax ( y Ay h y c,y el valor 
constante que toma s en el subrectángulo abierto i?;,. Aplicando (11.39) al rec- 
tángulo Rij encontramos 

Ax,Ayy = jjdxdy = JJ |J(«, u)| du dv. 

Ri! Rii* 

Multiplicando ambos miembros por c,-y y sumando respecto a los índices i, j 
obtenemos 

(11.41) 2 2 c «A* 4 Ay # = J JJ \ J ( U > »)l du dv ■ 

i=l 3=1 i=l 1=1 Rjj „ 

Puesto que s es una función escalonada, esto es lo mismo que 

(11.42) Ì Ì c u Axy Ay, = f f JJ s[A(u, v), Y(u, u)] \J(u, u)| du dv. 

' =1 Í=1 1=1 i=1 Ru* 


Utilizando la propiedad aditiva de las integrales dobles vemos que (11.42) es lo 
mismo que (11.40). Así pues, (11.40) es una consecuencia de (11.39). 

Seguidamente demostramos que la función escalonada s de (11.40) puede 
reemplazarse por cualquier función / para la cual existan ambos miembros de 
(11.40). Sea / integrable en un rectángulo R y elijamos funciones escalonadas 
s y t que satisfagan las desigualdades 

(11.43) s(x,y)£f(x,y)<t(x,ý), 
para todos los puntos (x,y) de R. Tenemos entonces 

(11.44) s[Jlf(u, v), Y(u, t>)] <f[X(u, v), Y(u, »)] < t(X(u, v), Y(u, »)] 
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para todo punto ( u, v) en la imagen R*. Por brevedad, escribimos S(u, v) en 
lugar de s[X(«, v), Y(u, v)] y definimos F(u, v) y T(u, v) de modo parecido. Mul- 
tiplicando las desigualdades de (11.44) por \J(u, v)j e integrando en R* obtenemos 


JJ S(u, v) \ J(u, íj)| du dv < JJ F(u, v ) |J(m, v)| du dv < JJ T(u, v) \J(u, t’)| du dv. 

R* R* R* 


Debido a (11.401, las desigualdades anteriores son las mismas que 


JJ s(x, y) dx dy < JJ F(u, v) \J(u, v)| du dv < JJ t(x, y) dx dy. 
r r* n 

Por consiguiente, // F(u, v) | J(u, v) | du dv es un número comprendido entre 

R‘ 

las integrales J/ s(x, y) dx dy e JJ t(x, y) dx dy para todo par de funciones esca- 

R R 

lonadas s y t elegidas que satisfagan (11.43). Ya que f es integrable, esto impli- 
ca que 


JjfiX’ y)dxdy = fj F(u, v) \J(u, v)l du dv 
R R • 

y por tanto (11.38) es válida para funciones integrables definidas sobre rec- 
tángulos. 

Una vez probada la validez de (11.38) para rectángulos podemos fácilmente 
extenderla a regiones S más generales por el procedimiento usual de elegir un 
rectángulo R que contenga a S y considerar en lugar de / otra función f que 
coincide con / en S y vale 0 fuera de S. Entonces observamos que 

JJ/= JJ/= Jjf[X(u, v), Y(u, v)] |J(M, 0)1 du dv = jj F(u, v)\J(u, v)| du dv 

S R R* T 

lo cual demuestra que (11.38) es, en realidad, una consecuencia de (11.39). 

11.31 Extensiones a un número mayor de dimensiones 

E1 concepto de integral múltiple puede extenderse del espacio de dos di- 
mensiones al de n dimensiones para cualquier «> 3. Puesto que el desarrollo 
es completamente análogo al caso n = 2 tan sólo apuntamos los principales re- 
sultados. 

E1 integrando es un campo escalar f definido y acotado en un conjunto S 
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del «-espacio. La integral de / en S, llamada integral n-múltiple, se representa 
mediante los símbolos. 

/ ’ '' jf, o /•'•/ /(*i,. • •, *„) dx^ • ■ • dx n , 

s s 

con n signos de integral, o más sencillamente con un signo integral, / s f(x) dx, 
en donde x = (x ^,..., x n ). Cuando n = 3 escribimos (x, y, z) en íugar de 
(x lt x 2 , x 3 ) y ponemos para las integrales triples 

////. ° jjjf(x,y,z)dxdydz. 

s s 

Definimos primero la integral n-múltiple para una función escalonada defi- 
nida en un intervalo n-dimensional. Recordemos que un intervalo cerrado n-di- 
mensional [a, b] es el producto cartesiano de n intervalos unidimensionales 
cerrados [au, bk ], en donde a = (a u ..., o«) y b = (b u ..., b n ). Un intervalo 
n-dimensional abierto (a, b) es el producto cartesiano de n intervalos abiertos 
(ak, bk). E1 volumen de [a, A] o de ( a , b) se define como el producto de las 
longitudes de los intervalos componentes 


(b 1 -a 1 )---(b n -a n ). 


Si ?!,..., P„ son particiones de [a u bf \,.... [a„, fe„], respectivamente, el 
producto cartesiano P =P X X ... X P„ será una partición de [ a, b]. Una fun- 
ción / definida en [ a, b] se llama escalonada si es constante en cada uno de los 
subintervalos abiertos determinados por una cierta partición P. Entonces la inte- 
gral ra-múltiple de una tal función escalonada está definida por la fórmula 


[ 0 , 5 ] > 

en donde Ci es el valor constante que toma / en el z'-ésimo subintervalo abierto 
y Vi es el volumen del z-ésimo subintervalo. La suma es una suma finita extendida 
a todos los subintervalos de P. 

A partir de la integral ra-múltiple para funciones escalonadas, definimos la 
integral para funciones acotadas más generales definidas en intervalos, siguiendo 
el método corriente. Sean s y t funciones escalonadas tales que / ^ í en 
[a, b]. Si existe un número / y sólo uno tal que 
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cualesquiera que sean s y t que satisfagan s < / < t, entonces se dice que / es 
integrable en [a, b\, y el número I es la integral n-múltiple de /, 


Como en el caso bi-dimensional, la integral existe si / es continua en [a,b\. 
También existe si / es acotada en [a, b] y si el conjunto de discontinuidad de / 
tiene contenido n-dimensional nulo. Un conjunto acotado S tiene contenido 
n-dimensional nulo si para todo e > 0 existe una colección fìnita de intervalos 
n-dimensionales cuya reunión cubre a S y tal que la suma de sus volúmenes no 
supera a e. 

Para defìnir la integrai n-dimensional de una función acotada / sobre un 
conjunto acotado S más general, consideramos una nueva función / extensión de 
/ y que coincide con ella en S y vale 0 fuera de S; la integral de / sobre S se 
define como la integral de / sobre un intervalo que contenga a S. 

Algunas integrales múltiples pueden calcularse mediante integrales reitera- 
das de dimensión inferior. Por ejemplo, supongamos que S es un conjunto 
en el espacio tri-dimensional defìnido así: 


(11.45) S = {(x, y,z)\{x,y)eQ y (p^x, ỳ)<,z<, (p 2 {x, y)}, 


siendo Q una región bi-dimensional, llamada proyección de S en el plano x, y, y 
(p^ y <f 2 funciones continuas en S. (En la figura 11.29 se muestra un ejemplo.) 
Los conjuntos de este tipo están limitados por dos superficies de ecuaciones car- 
tesianas z = (pi(x, y) y z = (p 2 (x, y) y (a veces) una porción de superficie cilín- 
drica engendrada por una recta que se desplaza paralelamente al eje z siguiendo 
la frontera de Q. Las rectas paralelas al eje z tienen comunes con ese conjunto 
segmentos rectilíneos que unen la superficie superior con la inferior. Si / es con- 
tinua en el interior de S tenemos la fórmula de iteración 


(11.46) JJJ/(x, y, z) àx dy dz = JJ [Jj^ f(x, y, z) dz] dx dy. 

S Q * 

Esto es, para x e y fijos, la primera integración se efectúa respecto a z desde la 
superficie frontera inferior hasta la superior. Esto reduce el cálculo a una integral 
doble sobre la proyección Q, que puede tratarse con los métodos antes expuestos. 

Existen otros dos tipos de conjuntos análogos a los descritos por (11.45) en 
los que los ejes x e y desempenan el papel del eje z, con las proyecciones en los 
planos yz o xz, respectivamente. Las integrales triples sobre tales conjuntos pue- 
den calcularse por iteración, con fórmulas análogas a (11.46). La mayoría de los 
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conjuntos tri-dimensionales que encontraremos son de uno de los tres tipos men- 
cionados o pueden descomponerse en un número finito de fragmentos, cada uno 
de los cuales es de uno de esos tipos. 

Existen muchas fórmulas de integración reiterada para las integrales n-múl- 
tiples cuando n > 3. Por ejemplo, si Q es un intervalo fc-dimensional y R un in- 
tervalo m-dimensional, entonces una integral (m + A:)-múltiple sobre Q X R es 
la iteración de una integral m-múltiple y una integral fc-múltiple. 

/■■■//=/•••/[/•• -Íf dx l • • • dx rS\ dx m +1 • ’ • dx m+k> 

QxR Q R 

con tal que existan todas las integrales múltiples que aparezcan en el cálculo. 
Luego veremos en este capítulo como se usan las integrales múltiples iteradas al 
calcular el volumen de una esfera «-dimensional. 

11.32 Cambio de variables en una integral n-múltiple 

La fórmula para efectuar un cambio de variables en una integral doble tiene 
una extensión directa para las integrales n-múltiples. Introducimos unas nuevas 
variables Ui,,u n ligadas a ,... ,x„ por n ecuaciones de la forma 
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Pongamos jc — (x t ,..., x„), u = (ïíi , ..., Un ), y X = (Xj,. .., X„). Entonces 
esas ecuaciones definen una aplicación vectorial 

X : r—s 

de un conjunto T del n-espacio en otro conjunto S del mismo. Supongamos que 
la aplicación X es uno a uno y derivable con continuidad en T. La fórmula de 
transformación para las integrales n-múltiples toma la forma 

(11.47) jj(x) dx = | r /W«)] |det DX(u) \ du, 

en donde DX(u) = [DjX k (u)] es la matriz jacobiana del campo vectorial X. En 
función de los componentes tenemos 

'DjXfu) D 2 Xfu) ••• D n Xfu) 

DX(u) = 

D k X n (u) D 2 X n (u) ••• D n X n (u) 

Como en el caso bi-dimensional, la fórmula de transformación es válida si 
X es uno a uno en T y si el determinante jacobiano J(u) = det DX(u) nunca es 
cero en T. Es también válida si la aplicación deja de ser uno a uno en un sub- 
conjunto de T que tenga contenido n-dimensional nulo, o si el determinante jaco- 
biano se anula en un tal subconjunto. 

Para el caso tri-dimensional escribimos (x, y, z) en lugar de (x lt x 2 , x s ), 
(u, v, w) en lugar de (u lt u 2 , uf) y (X, Y, Z) en lugar de (X u X 2 , X s ). La fórmula 
de transformación para las integrales triples toma la forma 

////(*. y,z)dxdydz 
s 

(11.48) ~ JJJ/t^( u < v > w )< ^( u < v > w )> z ( u < v > W )1 W u > v > w )l dii dv dw, 

T 

donde J(u, v, iv) es el determinante jacobiano, 

dX dY dZ 
du du du 
dX dY dZ 
dv dv dv 
BX dY dZ 
dw dw dw 


J(u, V, w) = 
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En el espacio tri-dimensional el determinante jacobiano puede imaginarse como 
un factor de ampliación de los volúmenes. En efecto, si introducimos la función 
vectorial r definida por la ecuación 

r(u, v, w) = X(u, v, w)i + Y(u, v, w)j + Z(u, v, w)k, 

y los vectores 

v dr 8X . dY . dZ 

v ' = ïu-T« , + Tu , + 7« k - 

r ‘ = Fv = T , + Tv J + T k - 
v*,f í + f J + f k , 

aw ow ow ow 

un razonamiento parecido al que se dio en la sección 11.26 sugiere que un ortoedro 
de dimensiones A u, Av, Aw del espacio uvw se transforma en un sólido, que es 
casi un «paralelepípedo» curvilíneo, en el espacio xyz determinádo por los tres 
vectores V x Au, F 2 Ay, y V 3 Aw. (Ver figura 11.30.) Las caras que limitan este 
sólido son superficies obtenidas haciendo u = constante, v = constante, y w = 
constante, respectivamente. E1 volumen de un paralelepípedo es igual al valor 
absoluto del producto mixto de los tres vectores que lo determinan, de manera 
que el volumen del paralelepípedo curvilíneo es aproximadamente igual a 

\(V,Au)-(V 2 Av) X (F,Aw)| = |F 1 -K 1 X V 3 \AuAvAw = \J(u,v,w)\AuAvAw. 




Figura 11.30 Transformación mediante coordenadas cilíndricas. 
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11.33 Ejemplos resueltos 

En los dos ejemplos que siguen se estudian dos casos particulares impor- 
tantes de (11.48). 

ejemplo 1. Coordenadas cilíndricas. Ponemos aquí r, 9, z en lugar de 
u, v,w y definimos la aplicación mediante las ecuaciones 

(11.49) x = r cos 0 , y = rsenO, z = z. 

Es decir, reemplazamos x e y por sus coordenadas polares en el plano xy y no 
cambiamos la z. También aquí, para conseguir una aplicación uno a uno debemos 
mantener r > 0 y limitar 6 a un intervalo de la forma 6 0 - 9 < 9 0 + 2-. La 
figura 11.30 muestra la transformación de un ortoedro del espacio rOz, 

E1 jacobiano de la aplicación (11.49) es: 


I cos 0 

J(r, 6, z) = — r send 
0 


sen 0 
r cos 0 
0 


0 

0 

1 


= r(cos a 0 + sen 2 0) = r, 


y por lo tanto, la fórmula de transformación (11.48) se convierte en 


/// /O. y> 2 > àx dy dz = /JJ f(r cos 0, rsenO, z)r dr dO dz. 

S T 

E1 jacobiano se anula cuando r = 0, pero esto no afecta la validez de la fórmula 
de transformación porque el conjunto de puntos con r = 0 tiene medida tri-di- 
mensional 0. 


ejemplo 2. Coordenadas esféricas. En este caso, en lugar de u, v, w pone- 
mos p, 0, <p y la aplicación se define por las ecuaciones 

x = p cos 0 sen <p, y = p sen 0 sen <p, z = p cos <p. 

E1 significado geométrico de p, 9, y <p se pone de manifiesto en la figura 11.31. 
A1 objeto de conseguir un aplicación uno a uno limitamos las coordenadas por 
p > 0, 0 ^ 9 < 2t r, y Ç) — <p < 7t. Las superficies p = constante son esferas con- 
céntricas de centro en el origen, las superficies 9 = constante son planos que pasan 
por el eje x, y las superficies <p = constante son conos circulares cuyo eje es el 
eje z. Por consiguiente, una caja rectangular en el espacio pOq> se transforma en 
un sólido del tipo que se ve en la figura 11.31. 
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Figure 11.31 Transformación mediante coordertadas esféricas. 

E1 jacobiano de la aplicación es 

cos 0 sen cp sen 0 sen <p cos <p 
J(p, 0, <p) = — psen0senç> pcos0senç) 0 = — /> 2 sen<p. 

pcos0cosç> psen0cosç? — psen<p 

Ya que sen <p ^ 0 si 0 ^ <p < tenemos |/(p, 0, <p )| = p 2 sen <p y la fórmula de 
transformación de integrales triples es: 

J JJ f(x, y, z) dx dy dz = JJJ F(p, 0, <p)p 2 sen <p dp dO d<p, 
s t 

donde F(p, 0 <p) = f(p cos 0 sen <p, p sen 0 sen <p, p cos <p). Si bien el jacobiano 
se anula cuando <p= 0 la fórmula de transformación es aún válida porque el con- 
junto de puntos con <p = 0 tiene medida tri-dimensional 0. 

En concepto de volumen puede extenderse a ciertas clases de conjuntos (lla- 
mados conjuntos medibles)del n-espacio de tal manera que si S es medible, su 
volumen es igual a la integral de la función constante igual a 1 en S. Esto es, 
si v(S) representa el volumen de S, tenemos 

v(S) = / ' ' ' J dx^ ■ ■ • dx„. 


No vamos a intentar describir la clase de los conjuntos para los que es válida 
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esta fórmula. En lugar de ello, expondremos como puede calcularse la integral 
en algunos casos particulares. 

EJEMPLO 3. Volumen de un intervalo n-dimensional. Si S es un intervalo 
n-dimensional, por ejemplo S = [«j, 6J X ... X [fln, &„], la integral múltiple 
para el cálculo de v(S) es el producto de n integrales uni-dimensionales, 

v(S) = j* 1 dx t • • • f* n dx n = (fe x -«!>••• (b n - a n ). 


Esto coincide con la fórmula dada antes para el volumen de un intervalo n-dimen- 
sional. 

ejemplo 4. Volumen de una esfera n-dimensional. Designemos con S n (a) 
la esfera n-dimensional (o n-esfera) de radio a dada por 


S„(a) = {(xì. x n ) | x\ + • • • + 4 ^ a 2 }, 

y sea 

V n (a ) = /••/ </*!-■• dx n , 


el volumen de S„(a). Demostraremos que 


(11.50) 


V n (a) 


, T nh 

ix*« + 1) û ’ 


donde T es la función gamma. Para n = 1 la fórmula da Vda) = 2 a, que es la 
longitud del intervalo \_—a, a]. Para n = 2 da V 2 (a) = ira 2 , que es el área de 
un disco circular de radio a. Demostraremos (11.50) para n > 3. 

Primero demostraremos que para todo a > 0 tenemos 


(11.51) 


V n (a) = a n V n (l). 


Dicho de otro modo, el volumen de una esfera de radio a es a n multiplicado por 
el volumen de una esfera de radio 1. Para probarlo hacemos el cambio lineal de 
variable x = au para aplicar S„(l) en S„(a). La aplicación tiene jacobiano igual 
a a n . Luego 


V„(a) = /•••/ dx x • • • dx n = f - • • / 


• ■ • du n = a n V n ( 1). 
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Esto demuestra (11.51). Por consiguiente, para demostrar (11.50) basta probar que 


(11.52) 


V n (í) = f 


r (in + 1) 

Observemos primero que x\ + • • • + x 2 < 1 si y sólo si 

x\ + • • • + x 2 „_ 2 < 1 - - xl y x\_ x + x 2 n < 1. 


Por lo tanto podemos escribir la integral que da V»(l) como la iteración de una 
integral (n — 2)-múltiple y una integral doble, del modo siguiente: 


(11.53) V n (í) = // [ / • • • / d Xl • • • dx„_ 2 ] dx n _! dx n . 

La inte sral interior está extendida a la esfera (n — 2)-dimensional S„- 2 (R), siendo 
R — VI — x \_ x — x n , con lo que es igual a 

V n -*(R) = R n ~*V n -Á 1) = (1 - xl-y - x*)"' 2 - 1 V„_ 2 ( 1). 

Ponemos ahora x en lugar de x„-i e y en lugar de x„. Entonces (11.53) toma la 
forma 

V n (ì) = V n _ t (\) J/ (1 - x 2 - y 2 )"' 2 - 1 dx dy. 

La integral doble la calculamos transformándola a coordenadas polares y obte- 
nemos 

V n (\) = V n _ 2 (\ )J* JJ (1 - r 2 ) B/2_1 r dr dd = V n _ 2 (\) ^ . 

Es decir, los números V„(l) satisfacen la fórmula de recurrencia 

V n (\) = — K„_ 2 (l) si n > 3. 
n 


Pero la sucesión de números {/(«)} definida por 


f(n) = 


7T b/2 

r(i« +1) 


satisface la misma fórmula de recurrencia debido a que T(j + 1) = jF(í). Asi- 
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mismo, JXV2) = (véase ejercicio 16, sección 11.28), con lo que r(%) = y 2 
y /(1) = VXl) = 2. También, /(2) = V 2 (l) = 7 r, luego tenemos /(«) = V„(l) 
para todo 1. Esto demuestra (11.52). 

11.34 Ejercicios 


Calcular cada una de las integrales triples en los ejercicios del 1 al 5. Representar en 
cada caso la región de integración. Supóngase la existencia de todas las integrales que se citan. 


í í I xy 2 z s dx dy dz, siendo S el sólido limitado por la superficie z = xy y los planos 

s ! 

y = x, x = 1, y z = 0. 

JJJ(1 + x + y + z)~ 3 dxdydz, siendo S el sólido limitado por los tres planos coor- 
denados y el plano x + y + z = t. 


3. JJJ xyzdxdydz, siendo S ={(*, y, z) x 2 + f + z 2 <, 1, x ;> 0 ,y t Ó, z ^ 0}. 

4. j J J ^ -f + -^dxdydz, siendo S el sólido limitado por el elipsoide 


5. JJJ \!x 2 +y 2 dxdydz, siendo S el sólido formado por la hoja superior del cono 

s 

z 1 = x 1 + y 2 y el plano z = 1. 


En los ejercicios 6, 7, y 8, una integral triple JJJ f(x, y, z) dx dy dz de una función 
s 

positiva se reduce a la integral reiterada dada. En cada caso dibujar la región de integración 
S mostrando su proyección sobre el plano xy. Expresar entonces la integral triple como una 
o más integrales reiteradas en las que la primera integraciófl se efectúa respecto a y. 


6 ‘ Jo (Jo *Ll: VU>y. z ) dzjdŷj dx. 

7 - ÍJ/Jv'SrJJL^ f^y > z )^] *y) dx - 

8 ' Jo( j: [j: +v f {x ’ z) dz ~\ dy ) dx ■ 

9. Demostrar que: 

/0 (/0 Lfo f {l)di ~] dU ) dv = \ J ffl {x ~ í) 2 /W<*. 


Calcular las integrales de los ejercicios 10, 11 y 12 pasando a coordenadas cilíndricas. 
Puede suponerse la existencia de todas las integrales que se citan. 

10. JJJ (x 2 + y 2 )dxdydz, siendo S el sólido limitado por la superficie x 2 + ý = 2z 

s 

y el plano z = 2. 
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11 JJJ dx dy dz, siendo S el sólido limitado por los tres planos coordenados, la super- 

s 

ficie z = x 2 + f,y el plano x + y = 1. 

12. ííí (y 2 + z 2 ) dx dy dz, siendo S un cono recto de revolución, de altura h, base situa- 
da en el plano xy y de radio a, y eje en el eje z. 

Calcular las integrales 13, 14, y 15 mediante la transformación a coordenadas esféricas. 

13. ÍÍJ dx dy dz, siendo S una esfera de radio a y centro en el origen. 

14. jfj dx dy dz, siendo S el sólido limitado entre dos esferas concéntricas de radios 

s 

a y b, (0 < a < b) y con centro en el origen. 

15. JJJ [(x - áf + (y — bf + (z — cf]~'+ dx dy dz, siendo S una esfera de radio R y 

centro en el origen, y (a,b, c) es un punto fijo en el exterior de esa esfera. 

16. Se pueden definir unas coordenadas esféricas generalizadas mediante la aplicación si- 
guiente: 

x = ap cos m 6sèn n <p, y = bpsen m 0sen n <p, z=cpcos n <p, 
donde a,b,c,m y n son constantes positivas. Demostrar que el jacobiano es igual a 

- abcmnp 2 cos ffl_1 Osen™- 1 0 cos n_1 ysen 2 »- 1 <p. 

Las integrales triples pueden emplearse para calcular volúmenes, masas, centros de gra- 
vedad, momentos de inercia, y otros conceptos físicos asociados a sólidos. Si S es un sólido su 
volumen V viene dado por la integral triple 

V = J[J dxdydz. 

s 

Si al sólido se asigna una densidad f(x,y,z) en cada uno de sus puntos (x,y,z) (masa por 
unidad de volumen), su masa M es: 

M = J JJ f(x,y,z)dxdy dz, 
s 

y su centro de gravedad el punto (x,ŷ, z)con coordenadas 

x =±jjjxf(x,y,z)dxdydz, 

y con cálculo parecido ŷ y z. E1 momento de inercia I„ respecto al plano xy se define por la 
igualdad 


= IJ J z 2 f(x, y,z)dx dy dz 
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y fórmulas parecidas para I yz e /„. E1 momento de inercia I L respecto a una recta L se define 
como 


7 l = JJJ ò \x, y, z)f(x, y, z ) dx dy dz, 


donde 8(x, y, z) representa la distancia de un punto genérico de S a la recta L. 

17. Demostrar que los momentos de inercia respecto a los ejes coordenados son 
4 = 4 » + J XZ, Iy = ly x + I yz , 4 = IZX + 4 V . 


18. Calcular el volumen de un sólido limitado por encima por la esfera x 1 + y 2 + z 2 = 5 
y por debajo por el paraboloide x 2 + y a = 4z. 

19. Calcular el vol umen de u n sólido limitado por el plano xy, el cilindro x 1 + y 2 = 2x, 
y el cono z = V z' + y'. 

20. Calcular la masa del sólido limitado por dos esferas concéntricas de radios a y b, 
(0 < a < b), si la densidad en cada punto es igual al cuadrado de su distancia al centro. 

21. Un cono circular recto homogéneo tiene altura h. Demostrar que la distancia de su cen- 
troide a la base es h/ 4. 

22. Determinar el centro de gravedad de un cono de altura h si su densidad en cada punto 
es proporcional a la distancia de ese punto a la base. 

23. fdem, suponiendo que la densidad en cada punto es proporcional a la distancia de ese 
punto al eje del cono. 

24. Un sólido está limitado por dos hemisferios concéntricos de radios a y b, siendo 
0 < a < b. Si la densidad es constante, encontrar el centro de gravedad. 

25. Determinar el centro de gravedad de un cubo de lado h si su densidad en cada punto 
es proporcional al cuadrado de la distancia de ese punto a un vértice de la base. (Tomar 
la base en el plano xy y situar las aristas en los ejes coordenados.) 

26. Un cono recto de revolución tiene altura h, radio en la base a, densidad constante, y 
masa M. Encontrar su momento de inercia respecto a un eje paralelo a la base y que 
pasa por el vértice. 

27. Calcular el momento de inercia de una esfera de radio R y masa M respecto a un diá- 
metro si la densidad es constante. 

28. Calcular el momento de inercia de un cilindro de radio a y masa M si su densidad en 
cada punto es proporcional a la distancia de ese punto al eje del cilindro. 

29. E1 tallo de una seta es un cilindro recto de revolución de diámetro 1 y longitud 2, y su 
cabeza es un hemisferio de radio R. Si la seta es un sólido homogéneo con simetría 
axial, y su centro de gravedad está situado en el plano en el que el tallo se une a la 
cabeza, calcular R. 

30. Un satélite artificial tiene una cubierta compuesta de porciones de dos cilindros de 
revolución de igual diámetro D cuyos ejes se cortan en ángulo recto. Hay el propósito de 
transportar el satélite a Cabo Kennedy en una caja cúbica de interior D. Demostrar que 
una tercera parte del volumen de la caja se pierde. 

31. Designemos con S„(a) el siguiente conjunto del n-espacio, siendo a > 0: 


5 »( fl ) ={( Jf i»---,Jf«)|k 1 l +•■• +|jc b | <,a}. 


Cuando 


- 2 el conjunto es un cuadrado con vértices en (0, ±a) y (±a, 0). Cuando 
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„ = 3 es un octaedro con vértices en (0,0, ±fl),(0, ±fl,0), y (±a,0,0). Llamemos V„(a) 
al volumen de S„(a) dado por 

V,W-J ■Jdx 1 -dx n . 


a) Demostrar que V„(a) = fl“V„(l). . . , 

b) Para „ > 2, expresar la integral que da V„(l) como una iteración de una ìntegral 
uni-dimensional y una integral („ — l)-múltiple y demostrar que 

V„(l) = K_i(1) (1 - |at|)”— 1 dx = ~ n V^l). 


c) Hacer uso de los apartados a) y b) para deducir que V„(fl) = 

32. Designemos con S„(a) el siguiente conjunto del n-espacio, siendo a > 0 y „ > 2: 

S„(a) ={(*!. x„) | \x t \ + |jc b | <. a para cada i' = 1. n - 1}. 

a) Esbozar un gráfico de S„(l) cuando „ = 2 y cuando „ = 3. 

b) Póngase V„(a) = J • • • J dx^ ■ ■ • dx n , y demostrar que V„(a) = a n V„(l). 

jS»(o) 

c) Expresar la integral que da V„(l) como una iteración de una integral uni-dimensio- 
nal y una integral („ - l)-múltiple y deducir que V„(a) = 2 n a n /n. 

33. a) En relación con el ejemplo 4, pág. 502. Expresar la integral que da V„(l), (volumen 
de la esfera n-dimensional unidad) como la iteración de una integral („ — l)-múltiple 
y una integral uni-dimensional y con ello demostrar que 

V B (1) -I^dJ^ÍI -x 2 Y n - 1)/2 dx. 
b) Con el apartado a) y la ecuación (11.52) deducir que 
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INTEGRALES DE SUPERFICIE 


12.1 Representación paramétrica de una superficie 

Este capítulo trata de las integrales de superficie y sus aplicaciones. Puede 
imaginarse la integral de superficie como el equivalente en dos dimensiones a 
una integral de línea siendo la región de integración una superficie en lugar de 
una curva. Antes de estudiar las integrales de superficie, tenemos que ponernos 
de acuerdo en lo que es una superficie. 

Hablando sin precisión, una superficie es el lugar de un punto que se mueve 
en el espacio con dos grados de libertad. En la parte de Geometna analitica del 
Volumen I vimos dos métodos para expresar analíticamente un tal lugar. Uno es 
la representcición implícita en el que se considera una superficie como un conjunto 
de puntos (.v, y, z) que satisfacen una ecuación de la forma F(x, y, z) = 0. Algu- 
nas veces podemos despejar en la ecuación una de las coordenadas en función de 
las otras dos, por ejemplo z en función de x e y. Cuando eso es posible obtene- 
mos una representación explícita dada por una o varias ecuaciones de la forma 
z = f(x, y). Por ejemplo, una esfera de radio 1 y centro en el origen tiene la re- 
presentación implícita x 2 + y- + z 2 - 1 = 0. A1 des pejar z se obtienen dos solu- 
ciones, z = V \ — x 2 — y- y z = — VI — x 1 — y 2 . La primera es la represen- 
tación explícita de la semiesfera superior y la segunda la de la inferior. ^ 

Existe un tercer método de representación de superficies que es más útil en 
el estudio de las mismas; es la representación paramétrica o vectorial por medio 
de tres ecuaciones que expresan x, y, z en función de dos parámetros u y v: 

(12.1) x = X(u,v), y = Y(u, v), z=Z(u,v). 

Aquí el punto (u, v) puede variar en un conjunto conexo bidimensional T en el 
plano uv, y los puntos (x, y, z) correspondientes constituyen una porción de super- 

509 



510 


Integrales de superficie 


ficie en el espacio xyz. Este método es análogo al de la representación de una curva 
en £ 3 mediante tres ecuaciones con un parámetro. La presencia de los dos pará- 
metros en (12.1) permite transmitir dos grados de libertad al punto (x, y, z), como 
sugiere la figura 12.1. Otro modo de expresar la misma idea consiste en decir que 
una superficie es la imagen de una región plana T por medio de la aplicación defi- 
nida por (12.1). 

Si introducimos el radio vector r que une el origen a un punto genérico 
(x, y, z ) de la superficie, podemos combinar las tres ecuaciones paramétricas (12.1) 



Figura 12.1 Representación paramétrica de una superficie. 
en una ecuación vectorial de la forma 

(12.2) r(u, v) = X(u, v)i + Y(u, v)j + Z(u, v)k, donde (u, v) e T. 

Ésta es la llamada ecuación vectorial de la superfìcie. 

Existen, naturalmente, muchas representaciones paramétricas de la misma su- 
perficie. Una de ellas puede obtenerse siempre a partir de la forma explícita 
z = f(x, y) tomando X(u, v) = u, Y(u, v) = v, Z(u, v) = f(u, v). Por otra parte, 
si es posible eliminar u y v en las ecuaciones paramétricas —por ejemplo, si pode- 
mos resolver las dos primeras ecuaciones (12.1) respecto a u y v en. función de 
x e y y sustituimos en la tercera— obtenemos la representación explícita z = 
f(x, y). 

ejemplo 1. Representación paramétrica de una esfera. Las tres ecuaciones 

(12.3) x — a cos u cos v , y = aseni/cos v, z = asenu 
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Figura 12.3 Deformación de un rectángulo en un hemisferio. 

representan una esfera de radio a y centro en el origen. Si elevamos al cuadrado. 
las tres ecuaciones (12.3) y sumamos resulta x 2 + y 2 + z 2 = a 2 , y vemos que todo 
punto (x, y, z) que satisface (12.3) está en la esfera. Los parámetros u y v en 
este ejemplo pueden interpretarse geométricamente como los ángulos dibujados 
en la figura 12.2. Si hacemos que el punto ( u, v) varíe en el rectángulo 
T = [0, 2tt] X[— \tt, |tt],1os puntos determinados por (12.3) describen toda la 
esfera. E1 hemisferio superior es la imagen del rectángulo [0, 2-] X [0, V^l y 
el inferior es imagen de [0, 2 tt] X [ — Vz’ 1 '. 0]. La figura 12.3 nos da una idea 
de como el rectángulo [0, 2?r] X [0, V^] es aplicado en el hemisferio superior. 
Imaginemos que el rectángulo es de un material plástico flexible capaz de estirarse 
o encogerse. La figura 12.3 muestra el rectángulo convertido por deformación en 
un hemisferio. La base AB se transforma en el ecuador, los lados opuestos AD y 
BC se hacen coincidir, y el lado superior DC degenera en un punto (el polo 
Norte). 
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ejemplo 2. Representación paramétrica de un cono. La ecuación vectorial 

r{u, v) = v sen a cos u i + v sen a sen uj + v cos a k 

representa el cono circular recto dibujado en la figura 12.4, donde a es el semi- 
ángulo en el vértice. También aquí, los parámetros u, v, admiten interpretaciones 
geométricas; v es la distancia desde el vértice al punto ( x, y, z) del cono, y u es 
el ángulo polar. Cuando (u, v) varía en un rectángulo de la forma [0, 2-] X 



Ficura 12.4 


Representación parumátrica de u 


Ficura 12.5 


rectángulo 


[0, h\, los correspondientes puntos (x, y, z) describen un cono de altura h cos «. 
Un rectángulo plástico puede, por deformación, convertirse en un cono haciendo 
coincidir los lados AD y BC, como indica la figura 12.5, y convirtiendo el lado 
AB en un punto (el vértice del cono). La superficie de la figura 12.5 muestra un 
estado intermedio de la deformación. 

En el estudio general de las superficies, las funciones X,Y,yZ que aparecen 
en las ecuaciones paramétricas (12.1) o en la ecuación vectorial (12.2) se suponen 
continuas en T. La imagen de T a través de la aplicación r se llama superficie 
paramétrica y se representará mediante el símbolo r(T). En muchos de los ejem- 
plos que comentaremos, T será un rectángulo, un disco circular, o algún otro con- 
junto conexo simple limitado por una curva cerrada simple. Si la función r es 
uno a uno en T, la imagen r(T) de denominará superficie paramétrica simple. En 
tal caso, puntos distintos de T se aplican en puntos distintos de la superficie. 
En particular, toda curva cerrada simple en T se aplica en una curva cerrada sim- 
ple situada en la superficie. 

Una superficie paramétrica r(T) puede degenerar en un punto o en una curva. 
Por ejemplo, si las tres funciones X, Y, Z son constantes, la imagen r(T) es un 
solo punto. Si X, Y y Z son independientes de v, la imagen r(T) es una curva. 
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Otro ejemplo de superficie degenerada se presenta cuando X(u, v) = u + v, 
Y(u, v) = (u + v) 2 , y Z(u, v) = (u + v) 3 , siendo T = [0, 1] X [0,1]. Si es- 
cribimos t = u + v vemos que la superficie degenera en una curva alabeada de 
ecuaciones paramétricas x = t, y = í 2 y z = f, donde 0 ^ t ^ 2. Estos casos 
excepcionales pueden evitarse imponiendo ciertas restricciones a la función r que 
define la aplicación, como se explica en la siguiente sección. 

12.2 Producto vectorial fundamental 

Consideremos una superficie representada por la ecuación vectorial 
r(u, v) = X(u, v)i -(- Y(u, v)j + Z(u, v)k, donde (u, v) e T. 

Si X,Y,y Z son derivables en T podemos considerar los dos vectores 

dr_ = d_X . dY . dZ^ 

du . du du du 

y 

dr = dX. dY 3Z 

dv dv dv J dv 


E1 producto vectorial drfdu x drfdv se denominará producto vectorial fundamental 
de la representación r. Sus componentes pueden expresarse como determinantes 
jacobianos. En efecto, tenemos. 


(12.4) 


i 

j 

k 


dY 

d7. 


r)7. 

r)X 


dX 

dY 

dX 

dY 

dz 


du 

du 


du 

du 


du 

du 

du 

du 

du 

= 

d_Y 

dZ 

i-f- 

dZ 

dX 

j + 

dX 

dY_ 

dX 

dY 

dZ 


dv 

dv 


dv 

dv 


dv 

dv 

dv 

dv 

dv 











d(Y,Z) . ^ d(z, X) . d(X, Y) t 
d(u, v) d(u, v) J d(u, v) 


Si (u, v) es un punto en T en el cual dr/du y drfdv son continuas y el pro- 
ducto vectorial fundamental no es nulo, el punto imagen r(u, v) se llama punto 
regular de r. Los puntos en los que no son continuas dr/du o drjdr o bien 
dr/du x dr/dv = O se llaman puntos singulares de r. Una superficie r(T) se llama 
regular si todos sus puntos son regulares. Toda superficie tiene más de una repre- 
sentación paramétrica. Algunos de los ejemplos que luego se comentan ponen de 
manifiesto que un punto de una superficie puede ser regular para una represen- 
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tación y singular para otra. Seguidamente explicamos el significado geométrico de 
los conceptos de puntos regulares y singulares. 

Consideremos en T un segmento rectilíneo horizontal. Su imagen por r es 
una curva (llamada M-curva) situada en la superficie r{T). Para v fija, imagine- 
mos que el parámetro u represente el tiempo. E1 vector dr/du es el vector velo- 
cidad de esta curva. Cuando u se incrementa en A u, un punto situado al princi- 
pio en r(u, v) se desplaza a lo largo de una u-curva una distancia aproximada- 
mente igual a \\dr/du\\Au puesto que \\dr/du\\ representa la velocidad a lo largo 
de la «-curva. Análogamente, para u fija un punto de una v-curva se desplaza en 
el tiempo Av una distancia aproximadamente igual a \\drfdv\\ àv. Un rectángulo 
en T que tenga un área A u Av se convierte en una porción de r(T) que aproxi- 
maremos por un paralelogramo determinado por los vectores (dr/du) Au y 
(dr/dv) Av. (Ver figura 12.6.) E1 área del paralelogramo determinado por 
(drjdu) Au y (drfdv) Av es el módulo de su producto vectorial 


dr . dr . \ 

— Au x —- Av 
II ou dv I 


— x — 
du dv 


Au Au. 


Por consiguiente la longitud del producto vectorial fundamental puede imaginarse 
como un factor de proporcionalidad de las áreas. En los puntos en los que este 
producto vectorial es nulo el paralelogramo degenera en una curva o en un punto. 
En cada punto regular los vectores dr/du y dr/dv determinan un plano que tiene 
el vector drfdu x drfdv como normal. En la próxima sección demostraremos 
que dr/du x drfdv es normal a toda curva regular en la superficie; por esta 
razón el plano determinado por drfdu y dr/dv se llama plano tangente a la super- 
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ficie. La continuidad de dr/du y dr/dv implica la continuidad de dr/du x dr/dv; 
esto. a su vez, significa que el plano tangente se mueve con continuidad en una 
superficie regular. Así vemos que la continuidad de drfdu y dr/dv evita la pre- 
sencia de aristas o «puntas» en la superficie; la no anulación de dr/du x dr/dv 
evita los casos degenerados antes citados. 

eiemplo 1. Superficies con representación explícita, z = f(x, y). Para una 
superficie con una representación explícita de la forma z = f(x, y), podemos usar 
x e y como parámetros, lo que nos da la ecuación vectorial 

r(x ,)-) = xi + yj + f(x, y)k. 

Esta representación nos da siempre una superficie paramétrica simple. La región T 
se denomina proyección de la superficie sobre el plano xy. (En la figura 12.7 se 
muestra un ejemplo.) Para calcular el producto vectorial fundamental observe- 
mos que 


F~‘ + f k 


f-i+f*. 

oy oy 


si / es diferenciable. Esto nos da 


(12.5) 


dx } 


ox oy 


Puesto que el componente z de dr/dx x dr/dy es 1, el producto vectorial funda- 
mental nunca es cero. Luego los únicos puntos singulares que pueden presen- 
tarse por esta representación son puntos en los que al menos una de las deriva- 

das parciales dffdx o dffdy no es continua,_ 

Un caso típico es la ecuación z = x 1 — x 2 — >- 2 , que representa un hemis- 
ferio de radio 1 y centro en el origen, si x 2 + y 2 ^ 1. La ecuación vectorial 


r(x, y) = xi + yj + yjl — x 2 — y 2 k 


aplica el disco unidad T = {(x, y) ! x 2 + y 2 - 1} sobre el hemisferio y dicha apli- 
cación es uno a uno. Las derivadas parciales drjdx y dr/dy existen y son conti- 
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nuas en todo el interior del disco, pero no existen en la periferia. Por consiguiente, 
todo punto del ecuador es un punto singular de esta representación. 

E[emplo 2. Consideremos el mismo hemisferio del ejemplo anterior, pero 
esta vez como imagen del rectángulo T = [0, 2x] x [0, y 2 -] a través de la apli- 
cación 


r(u, v) = a cos u cos v i + asen u cos vj + a sen v k. 

Los vectores dr/du y dr/dv vienen dados por las fórmulas 
dr . 

— = — a sen u cos v i + a cos u cos vj, 
au 


— = — a cos u sen v i — a sin u sen v j + a cos vk. 
dv 

Un sencillo cálculo muestra que su producto vectorial es igual a 
dr dr 

— X — = a cos v r(u, v). 
ou ov 

La imagen de T no es una superficie paramétrica simple a causa de que esta apli- 
cación no es uno a uno en T. En efecto, todo punto del segmento rectilíneo 
v = y 2 7r, 0 — u — 2— se aplica en el punto (0, 0, a) (el polo Norte). También, por 
la periodicidad del seno y coseno, r toma los mismos valores en los puntos (0, v) 
y (2—, v), de modo que los lados izquierdo y derecho de T se aplican en la misma 
curva, que es un arco que une el polo Norte al punto (a, 0, 0) del ecuador. (Véase 
figura 12.3.) Los vectores dr/du y dr/dv son continuos en todo T. Puesto que 
j 1 drjdu X drjdv = a 2 cos v,los únicos puntos singulares de esta representación 
se presentan cuando cos v = 0. No hay otro punto singular que el polo Norte. 

12.3 E1 prcducto vectorial fundamental, considerado como una normal a la 
superficie 

Consideremos una superficie paramétrica regular r(T), y sea C* una curva 
regular en T. La imagen C = r(C*) es entonces una curva regular situada en la 
superficie. Demostraremos que en cada punto de C el vector dr/du X drjdv es 
normal a C, como se ve en la figura 12.6. 

Supongamos que C* está descrita por una función ct definida en un intervalo 
\_a, fe], por ejemplo sea 


<x(í) = U(t)i+ V(t)j. 
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Entonces la imagen de la curva C está representada por la función compuesta 
P(0 = r[«(0] = JT[«(0]i + Y[a(t)]j+Z[a(t)]k. 

Queremos demostrar que la derivada p'(í) es perpendicular al vector dr/du X 
drjdv cuando las derivadas parciales drjdu y drjdv están calculadas en (U(t), 
V(t)). Para calcular p'(f) derivamos cada componente de p(/) mediante la regla 
de la cadena (teorema 8.8) para obtener 

(12.6) P'(0 = VZ • a'(t)i + V Y • a'(t)j + VZ • a'(t)k, 

donde los vectores gradientes V X, V Y, y VZ están calculados en (U(t), V(0) • 
La ecuación (12.6) puede escribirse en la forma 

P'(0 = r U’(t) + V'(t), 

ou ov 

estando calculadas las derivadas dr/du y dr/dv en (1/(0. V(0). Ya que drjdu y 
dr/dv son perpendiculares en cada punto al producto vectorial dr/du X drjdv , lo 
mismo ocurre con p'(0- Esto demuestra que dr/du x drjdv es normal a C, como 
queríamos probar. Por esta razón, el vector dr/du X drjdv se denomina normal 
a la superficie r(T). En cada punto regular P de r(T) el vector drjdu X drjdv es 
distinto de cero; el plano que pasa por P y tiene este vector como normal se llama 
plano tangente a la superficie en P. 

12.4 Ejercicios 


En los ejercicios del 1 al 6, eliminar los parámetros u y v para obtener la ecuación 
cartesiana, probando así que la ecuación vectorial dada representa la superficie que se cita. 
Calcular también el producto vectorial fundamental Br/Bu X dr/dv en función de u y V. 

1. Plano: 

r(u, v ) = (x 0 + a x u + b x v)i + (y 0 + a 2 u + b 2 v)j + (z 0 + a 3 u + b 3 v)k. 

2. Paraboloide elíptico: 
r(u, v) = au cos v i + bu senvj + u 1 2 3 4 5 6 k. 

3. Elipsoide: 

r(u,v) = a sen u cos vi + b sen u sen vj + c cos u k. 

4. Superficie de revolución: 
r(u, v) = u cos v i + u sen vj + f(u)k. 

5. Cilindro: 

r(u, v) = ui + asen vj + a cos v k . 

6. Toro: 

r(u, v) = (a + b cos u) sen v i + (a + b cos u) cos vj + b sen u 


i k, donde 0 < b < a. 
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tCuál es el significado geométrico de a y b? 

En los ejercicios 7 al 10 calcular la magnitud del producto vectorial fundamental 
en función de u y v. 

7. r(u, v ) = asenu cosh vi + b cos u cosh vj + csenh v k. 

8. r(u, v) = (u + v)i + (u - v)j + 4 v 2 k. 

9. r(u, v) = (u + v)i + ( u 2 + v 2 )j + (u 3 + i; 3 )*. . 

10. r(u, v) = u cos vi + u sen vj + |« 2 .sen 2v k. 

12.5 Área de una superficie paramétrica 

Sea S = r(T) una superficie paramétrica representada por la función r defi- 
nida en una región T del plano uv. En la sección 12.2 vimos que la longitud del 
producto vectorial fundamental dr[du X dr/dv puede interpretarse como un fac- 
tor de proporcionalidad de áreas. (Véase figura 12.6) Un rectángulo en T de área 
A u Av es aplicado por r sobre un paralelogramo curvilíneo en S con área apro- 
ximadamente igual a 


I ^ r 

I du 


dr I 

— Av . 
dv 


Esta observación sugiere la siguiente definición. 


DEFINICIÓN DE ÁREA DE UNA SUPERFICIE PARAMÉTRICA. El área de S, que 

representamos por a (S), se define por la integral doble 


( 12 . 7 , »( S )-J/|||x||| áuá ». 

T 

Dicho de otro modo, para determinar el área de S calculamos primero el pro- 
ducto vectorial fundamental dr/du X drfdv e integramos entonces su longitud en 
la región T. Cuando drfdu X drfdv está expresado en función de sus componen- 
tes, por medio de la ecuación (12.4), tenemos. 


( 12 . 8 ) 



Escrita en esta forma, la integral para el área de una superficie se parece a la inte- 
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gral usada para calcular la longitud de un arco de curva.(*) 

Si S viene dada explícitamente por una ecuación de la forma z = f(x, y) po- 
demos usar x e y como parámetros. E1 producto vectorial fundamental es el de la 
ecuación (12.5), de este modo tenemos: 


En este caso, la integral para calcular el área de la superficie toma la forma: 


(12.9) «(S)=JJ^ + (|)'+(|J<í^y. 

T 

donde la región T es ahora la proyección de S en el plano xy, como se ve en la 
figura 12.7. 



Figura 12.7 Superjicie S con una representación explíciia, z = j(x,y). La región T es la 
proyección de S sobre el plano xy. 

(*) Puesto que en la integral (12.7) interviene r, el área de una superfìcie dependerá de 
la función utilizada para representar la superfìcie. Cuando comentemos las integrales de 
superficie demostraremos (en la sección 12.8) que bajo ciertas condiciones generales el área es 
independiente de la representación paramétrica. E1 resultado es análogo al del teorema 10.1, en 
el que se discutió la invariancia de las integrales de línea frente a un cambio de parámetro. 
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Cuando S está en un plano paralelo al plano xy, la función / es constante, de 
modo que dfjdx = df/dy = 0, y la ecuación (12.9) se convierte en: 

a(S) = j J dx dy. 

T 

Que coincide con la fórmula corriente para el cálculo de áreas de regiones planas. 

La ecuación (12.9) puede escribirse en otra forma que nos hace comprender 
mejor su significado geométrico. En cada punto de S, sea y el ángulo formado por 
el vector normal N = dr/dx x drfdy y el vector unitario coordenado k. (Véase 
figura 12.8.) Puesto que el componente z de N es 1, tenemos: 

cos = Nk 1 1 
cosy mm ii^vii ||sr v ar|r 

\\dx dy\\ 

y por tanto, || drfdx X dr/dy || = 1/cosy. Por consiguiente, la ecuación (12.9) 
toma la forma: 

(12.10) “($)= ÍÍ-^—dxdy. 

cos y 

Supongamos ahora que S está en un plano no perpendicular al plano xy. En 
tal caso y es constante y la ecuación (12.10) establece que área de S = (área 
de T)/ cos y, o que 


( 12 . 11 ) 



Ficlk\ 12.8 La lonaitud de — x — es 1 /cos y. Ficura 12.9 La regla del coseno para 
x °y un rectángulo. 
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La ecuación (12.11) se denomina algunas veces regla del coseno. Nos dice que 
si una región S de un plano se proyecta en una región T de otro plano, que forma 
un ángulo y con el primero, el área de T es igual al producto de cos y por el área 
de S. Esta fórmula es evidentemente cierta cuando S es el rectángulo dibujado en 
la figura 12.9, pues las distancias en una dirección quedan reducidas por el factor 
cos y mientras que las de dirección perpendicular no se alteran en la proyección. 
La ecuación (12.11) extiende esta propiedad a cualquier región plana S. 

Supongamos ahora que S viene dada implícitamente por la ecuación 
F(x, y, z) = 0. Si S puede proyectarse en forma uno a uno sobre el plano xy, la 
ecuación F{x, y,z)= 0 define z como función de x e y, sea ésta z = f{x, y), y las 
derivadas parciales df/dx y df/dy están relacionadas con las de F mediante las 
ecuaciones 


df_ _ _ dFjdx df _ _ dF/dy 

dx dF/dz y dy dFjdz 

en los puntos en los que 8F/3z ¥= 0. Sustituyendo esos cocientes en (12.9), encon- 
tramos: 


„ 2.12) «»-f 

\oFjdz\ 

ejemplo 1. Área de un hemisferio. Consideremos un hemisferio S de radio a 
y centro en el origen. Dis ponemos de la representación implícita x 2 +y 2 + z 2 =a 2 , 
z ^ 0; la explícita z = V a 2 — x 2 — y 2 ; y la paramétrica 

(12.13) r(u, v) = acosucosvi + asenucos vj + asenvh. 

Para calcular el área de S a partir de la representación implícita utilizaremos 
la fórmula (12.12) tomando 

F(x,y, z) = x 2 + y 2 + z 2 - a 2 . 

Las derivadas parciales de F son dFldx = 2x, dFjdy = 2y, dFjdz = 2z. E1 hemis- 
ferio S se proyecta en forma uno a uno sobre el disco D = {(*, y) | x 2 + y 2 < a 2 } 
en el plano xy. No podemos aplicar la fórmula (12.12) directamente porque la 
derivada dF/dz es nula en la frontera de D. No obstante, dicha derivada no es 
nula en todo punto interior de D, de modo que podemos considerar un disco me- 
nor concéntrico D(R) de radio R, siendo R < a. Si S(R) representa la porción 
correspondiente del hemisferio superior, la (12.12) es ahora aplicable y resulta: 
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areade5 W= íf^ 2 + ^ + ^ 2 ^^ 

Áí) l 2Z l 

= JJ ~ dx dy — a ÍT 1 dxdy. 

orn Z mio Va 2 -x 2 -/ 

La última integral puede calcularse fácilmente en coordenadas polares, obteniendo: 
area de S(R) = a J J^J -- _ 1 r rfrj dd = 27ra(a — yj a 2 — R z ). 

Cuando R a resulta como límite 27ra 2 . 

Puede eludirse el paso al límite en el cálculo precedente empleando la re- 
presentación paramétrica (12.13). Los cálculos del ejemplo 2 de la sección 12.2 
muestran que 


II Ìh X ^ II = cosvr ^ u ' = a * l cos • 

Por lo tanto, podemos aplicar la fórmula (12.7), tomando como región T el rec- 
tángulo [0, 2 tt] X [0, Ì7r]. Obtenemos: 

a(S ) = a s JJ |cos t>| du dv = a 2 /**[J* / cos v daj du = h ra 2 . 

T 

ejemplo 2. Otro teorema de Pappus. Uno de los teoremas de Pappus esta- 
blece que una superficie de revolución, obtenida por la rotación de una curva 
plana de longitud L alrededor de un eje situado en el plano de la curva, tiene por 
área 2rrL/t siendo h la distancia desde el centro de gravedad de la curva al eje 
de rotación. Usaremos la fórmula (12.7) para demostrar este teorema en un caso 
especial de superficie de revolución. 

Supongamos una curva C, inicialmente en el plano xz, que gira alrededor del 
eje z. Sea z = f(x), su ecuación en el plano xz, donde a Kx ^ b, a > 0. La super- 
ficie de revolución S así engendrada puede representarse por la ecuación vectorial 

r(u, v) = u cos vi + u sen vj+ f(u)k , 

donde (u, v) e [a, b ] X [0, 2tt]. Los parámetros u y v pueden interpretarse como 
el radio y ángulo polares, como se ve en la figura 12.10. Si a < u < b, todos los 
puntos (x,y,z) situados a una misma distancia u del eje z, tienen la misma coor- 
denada z, f(u), de manera que están todos en la superficie. E1 producto vectorial 
fundamental de esta representación es: 
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Figura 12.10 Área de una superficie de revolución determinada medìante el teorema 
de Pappus. 


— X - 
du dv 


j 


sen v 


k 

/'(«) 

0 


—uf'(u) cos vi — «/'(«)sen vj + uk, 


y por tanto, 

|||x|||-„vrn7w. 

Por consiguiente, la fórmula (12.7) se convierte en: 


«($) = /<T [// u ^ 1 + d “] dv = 277 // « >/1 + [/'(m)] 2 c(m . 


La integral que resulta puede expresarse como f c xds, que es una integral de 
línea respecto a la longitud del arco tomada a lo largo de C. Como tal, vale xL, 
donde x es la coordenada x del centro de gravedad de C y L la longitud de C. 
(Véase sección 10.8.) Luego el área de S es 2^Lx. Esto demuestra el teorema de 
Pappus en la superficie del ejemplo considerado. 
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12.6 Ejercicios 


1. Sea S un paralelogramo de lados no paralelos a ningún eje coordenado. Sean Si, S2 y S3 
las áreas d e las proyecci ones de S sobre Ios planos coordenados. Demostrar que el área 
de S es Js 2 + S| + S|. 

2. Calcular el área de la región que en el plano x + y + z = a determina el cilindro 

3. Calcular el área de la porción de esfera x- + y- + z- = a- interior al cilindro 

-v- + y- = ay, siendo a > 0. 

4. Calcular el área de la porción de superficie z- = 2xy que se proyecta en el primer 

cuadrante del plano xy y limitada por los planos x = 2 e y = 1. 

5. Dada una superficie S de ecuación vectorial 

r(u, v) = u cos v 1 + u sen vj + u 2 k, 
donde 0<«<4 y 0 < v < 2’û. 

a) Demostrar que S es una porción de cuádrica. Identificar dicha cuádrica, dibujarla 
e indicar el significado geométrico de los parámetros u y v en la superficie. 

b) Calcular el producto vectorial fundamental dr/du x dr/dv en función de u y v. 

c) E1 área de S es tt(65 y/~S5 — 1 )/n, donde tt es entero. Calcular el valor de n. 

6. Calcular el área de la porción de superficie cónica x 2 + y 2 = z 2 situada por encima del 
plano xy y Iimitada por la esfera x 2 + y 2 + z 2 = 2ax. 

7. Calcular el área de la porción de superficie cónica x 2 + y 2 = z 2 situada entre los 
dos planos z = 0 y x + 2z = 3. 

8. Calcular el área de la porción de paraboloide x 2 + y 2 = 2ay cortada por el plano y = a. 

9. Calcular el área del toro de ecuación vectorial 

r(u, v) = (a + b cos u) sen v i + (a + b cos u) cos vj + bstnuk, 

donde 0 < b < a y 0<«< 2 t, 0 < v < 2 tt. Utilizar el teorema de Pappus para com- 
probar el resultado. 

10. Una esfera está inscrita en un cilindro circular recto. La esfera es cortada por dos planos 
paralelos perpendiculares al eje del cilindro. Demostrar que las porciones de la esfera 
y del cilindro comprendidas entre esos dos planos tienen la misma área. 

11. Sea T el disco unidad en el plano uv, T = {(«, v) u 2 + v 2 < 1}, y pongamos 


a) Determinar la imagen por r de cada uno de los siguientes conjuntos: la circunferen- 
cia unidad u 2 + v 2 = 1; el intervalo — 1 < u < 1; la parte de la recta u = v situada 
en T. 

b) La superficie S = r(T) es muy conocida. Decir cuál es y dibujarla. 

c) Determinar la imagen por r del plano uv. Indicar con un gráfico en el espacio xyz los 
significados geométricos de los parámetros u y v. 
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12.7 Integrales de superficie 

En muchos aspectos, las integrales de superficie son análogas a las integrales 
de línea. Definimos las integrales de línea mediante una representación paramé- 
trica de la curva. Análogamente, defmiremos las integrales de superficie en fun- 
ción de una representación paramétrica de la superficie. Demostraremos iuego 
que en ciertas condiciones generales el valor de la integral es independiente de la 
representación. 

definición de integral de suPERFiciE. Sea S = r(T) utia superficie pa- 
ramétrica descrita por una función diferenciable r definida en una región T del 
plano uv, y sea f un campo escalar definido y acotado en S. La integral de super- 
ficie de f sobre S se representa con el símbolo JJ f dS [o por /J j(x, y, z) dS] : 
y está definida por la ecuación nT) s 

02.14) JJf dS ~ ÍJ /W “' || * | | Ju * 

siempre que exista la integral doble del segundo miembro. 

Los ejemplos que siguen ilustran algunas aplicaciones de las integrales de 
superficie. 

ejemplo 1. Área de una superficie. Cuando / = 1, la ecuación (12.14) se 
transforma en 


JJ dS -Sj\\r u x ïk d ’- 

La integral doble del segundo miembro es la que se usó en la sección 12.5 para 
definir el área de una superficie. Así pues, el área de S es igual a la integral de 
superficie JJ dS. Por este motivo, el símbolo dS se llama algunas veces «elemento 

r{T) 

de área de la superficie», y la integral de superficie JJ f dS se lee integral de / 

r{T) 

respecto al elemento de área, extendida a la superficie r(T). 

ejemplo 2. Centro de gravedad. Momento de inercia. Si el campo escalar / 
se interpreta como la densidad (masa por unidad de área) de una lámina delgada 
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adaptada a la superfìcie S, la masa total m de la superficie se define por la fórmula 

« = ///(*. y, z)ds. 

Su centro de gravedad es el punto (Jc, ŷ, z) determinado por las fórmulas 

xm = jj xf(x,y,z)dS, ŷm = // yf(x, y, z) dS, zm = /j zf(x, y, z) dS. 
s s s 

E1 momento de inercia I L de S alrededor de un eje L viene dado por 

I L = // <5 2 (*> y> z)/(x, y, z) dS, 
s 

donde 8(x, y, z) representa la distancia de un punto genérico (x, y, z) de S a la 
recta L. 

Como ejemplo, determinemos el centro de gravedad de la superfìcie de una 
semiesfera uniforme de radio a. Utilicemos la representación paramétrica 

r(u, v) = a cos u cos vi + a sen u cos vj + asenv k, 

en la que (u, v) e [0,2x] X [0,Ì7r]. Esta representación ya fue discutida en el 
ejemplo 2 de la sección 12.2, donde encontramos que la magnitud del producto 
vectorial fundamental es a 2 |cosv|. En este ejemplo la densidad / es constante, 
pongamos f = c, y la masa m es 27 -a 2 c, c veces el área de S. Debido a la sime- 
tría, las coordenadas x e ŷ del centro de gravedad son 0. La coordenada z viene 
dada por 


zm = c j j z dS = c j j a sen v ■ a 2 |cos a| du dv 
s T 

M 2 a 

= 2wa c sen v cos v dv = na 3 c = - m, 

J o 2 


de modo que z = a/2. 

fjemplo 3. Flujo de fluido a través de una superficie. Imaginemos que 
un fluido es una colección de puntos llamados partículas. A cada partícula (x, y, z) 
asignamos un vector V (x, y, z) que representa su velocidad. Este es el campo de 
velocidad de la corriente. E1 campo de velocidad puede o no cambiar con el tiem- 
po. Consideraremos tan sólo corrientes estacionarias, esto es, corrientes para las 



Cambio de representación paramétrica 527 

que la velocidad V (x, y, z) depende únicamente de la posición de la partícula y no 
del tiempo. 

Designemos con p(x, y, z) la densidad (masa por unidad de volumen) del 
fluido en el punto (x, y, z). Si el fluido es incompresible la dentidad p será cons- 
tante en todo el fluido. Para un fluido compresible, tal como un gas, la densidad 
puede variar de un punto a otro. En cualquier caso, la densidad es un campo 
escalar asociado a la corriente. El producto de la densidad por la velocidad la re- 
presentamos por F ; esto es, 

F(x, y, z) = p(x, y, z)V(x, y, z). 


Este es un campo vectorial llamado densidad de flujo de la corriente. E1 vector 
F(x,y,z) tiene la misma dirección que la velocidad, y su longitud tiene las di- 
mensiones 

masa distancia _ masa 

unidad de volumen unidad de tiempo (unidad de área)(unidad de tiempo) 


Dicho de otro modo, el vector densidad de flujo F (x, y, z) nos dice cuánta masa 
de fluido circula por el punto (x, y, z) en la dirección de V (x, y, z), por unidad de 
área y de tiempo. 

Sea S = r(T) una superfìcie paramétrica simple. En cada punto regular de 
S designemos con n el vector unitario normal que tenga el mismo sentido que 
el producto vectorial fundamental. Esto es, 


(12.15) 


n 


— x — 


lll 


dv 



E1 producto escalar F • n representa et componente del vector densidad de flujo 
en la dirección de n. La masa de fluido que pasa a través de S en la unidad de 
tiempo en la dirección de n se define con la integral de superficie 


r(Tì 
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du dv. 


12.8 Cambio de representación paramétrica 

Volvamos nuevamente a la discusión de la independencia de las integrales de 
superficie de los cambios de representación paramétrica. Supongamos que una 
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función r aplica una región A del plano uv sobre una superfìcie paramétrica r(À). 
Supongamos también que A es la imagen de una región B del plano st a través de 
una aplicación uno a uno derivable con continuidad G dada por 

(12.16) G(s, t ) = U(s, t)i + V(s, t)j si (s, t)eB. 

Ccnsideremos la función R definida en B mediante la ecuación 

(12.17) R ( s > 0 = r [ G (- s '> 01 • 

(Véase figura 12.11.) Dos funciones r y R así relacionadas se denominarán regu- 
larmente equivalentes. Funciones regularmente equivalentes representan la misma 
superfìcie. Esto es, r(A) y R(B) como conjuntos de puntos son idénticos. (Esto 
resulta inmediatamente del hecho de ser G uno a uno.) E1 siguiente teorema trata 
de la relación entre sus productos vectoriales fundamentales. 



Figura 12.11 Dos represeniaciones paramétricas de la misma superficie. 

teorema 12.1. Sean r y R dos funciones regularmente equivalentes ligadas 
por la ecuación (12.17), donde G = Ui + Vj es una aplicación, uno a uno y deri- 
vable con continuidad, de una región B del plano st sobre una región A del plano 
uv dada por la ecuación (12.16). Tenemos entonces 

d_R dR _ /3r dr\ d(U, V) 

ds X dt \3m dv/ d(s, t) 


(12.18) 
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donde las derivadas parciales drjdu y dr/dv están calculadas en el punto ( U(s,t ), 
V(s, t)). Dicho de otro modo, el producto vectorial fundamental de R es igual al 
de r, multiplicado por el determinante jacobiano de la aplicación G. 

Demostración. Las derivadas dRfds y dRfdt pueden calcularse por deriva- 
ción de (12.17). Si aplicamos la regla de la cadena (teorema 8.8) a cada compo- 
nente de R y reordenamos los términos, encontramos que 


dR-dr^dU drdV_ d_R = fodU + drdV 

ds du ds dv ds ^ dt du dt dv dt 

donde las derivadas dr/du y dr/dv están calculadas en (U(s, t), V(s, t )). Multipli- 
cando vectorialmente esas dos ecuaciones obtenemos: 

dR dR = /dr_ 3r\ /dU dV _ dU 3K\ /dr dr\ d(U, V) 

ds dt \3u dv/ \ ds dt dt ds / \3u dv/ d(s, t) 

Como queríamos demostrar. 

La invariancia de las integrales de superficie frente a las representaciones para- 
métricas regularmente equivalentes resulta ahora como consecuencia inmediata 
del teorema 12.1. 

teorema 12.2. Si r y R son dos funciones regularmente equivalentes, 
como las descritas en el teorema 12.1 y si la integral de superficie JJ f ds existe, 
entonces también existe J | f ds y tenemos r(A) 

R(ïi) 

ff/dS - ff/dS. 

r(A) R(IS) 

Demostración. Según la definición de integral de superfìcie tenemos 

jl fdS= tt m “M\ d £ x ïv\\ ,luJv - 

Utilicemos ahora la aplicación G del teorema 12.1 para transformar esa integral 
en una integral doble extendida a la región B del plano st. La fórmula de trans- 
formación de las integrales dobles establece que 


JJ/[»*(m. v)] || ^ x | du dv 


J[/{r[G(s,í)]} 

n 


dr 

dv 


d(U, V) 
d(s, t) 


ds dt, 
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en donde las derivadas drfdu y dr/dv del segundo miembro están calculadas en 
(í/(s, t), V(s, t)). En virtud de la ecuación (12.18), la integral sobre B es igual al 

Esto es la definición de la integral de superficie JJ / dS. Con lo cual queda 
completa la demostración. w ’ 

12.9 Otras notaciones para las integrales de superficie 

Si S = r(T) es una superficie paramétrica, el producto vectorial fundamental 
N = dr/du x dr/dv es normal a S en cada punto regular de la superficie. En cada 
uno de tales puntos existen dos vectores normales unitarios, uno que tiene la 
misma dirección que N, y otro /i 2 que tiene dirección apuesta. Así pues, 



Sea n una de las dos normales n x ó n 2 . Sea F un campo vectorial definido en S 
y supongamos que la integral de superficie JJ F ■ n dS exista. Podemos entonces 
escribir 

(11,9) JJj-. ndS — JJfMu, u)] • n(u, v) II X II du dv 

S T 

= ±JJ F(r(u,v)]-^-x Y v dudv > 

T 

donde el signo + se usa si n = »i y el signo — si n = n 2 . 

Supongamos ahora que expresamos F y r en función de sus coordenadas, 

F(x, y, z) = P(x, y, z)i + Q(x, y, z)j + R(x, y, z)k 

y 

r(u, v) = X(u, v)i + Y(u, v)j + Z(u, v)k. 

E1 producto vectorial fundamental de r viene entonces dado por 

N _ dr ,, dr _ d(Y, Z) . d(Z, X) d(X, Y) y 

du dv d(u, v) d(u, v) d(u, v) 
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Si n = n lt la ecuación (12.19) se transforma en 

í í F ■ n dS = f I P[r(u, r)] du dv 

3 y 3(u, v) 

(12.20) + ÍT Q[r(u,v)]^~ du dv + [ f R[r(u, v)]— 1 -^ du dv ; 

JJ o(u, v) JJ d(u, v) 

si n = n 2 , cada una de las integrales dobles del segundo miembro debe reempla- 
zarse por su opuesta. Frecuentemente la suma de las integrales dobles del segundo 
miembro se escribe más brevemente poniendo 

|/ P(x, y, z) dy A dz + // Q(x, y, z) dz A dx + // R(x, y, z) dxAdy, 
(12.21? 

o aun con mayor simplicidad 

(12.22) Pdy Adz + Qdz Adx + Rdx Ady. 
s 

Las integrales que aparecen en (12.21) y (12.22) pueden expresarse como inte- 
grales de superfìcie. Así, por ejemplo, la integral de superficie JJ P dy A dz está 
definida por la ecuación * 

(12.23) JJ P dy A dz = JJ P[r(u, t>)] du dv . 


Esta notación está sugerida por la fórmula del cambio de variables en una integral 
doble. 

A pesar del parecido en la notación, la integral del primer miembro de (12.23) 
no es una integral doble. Ante todo, P es una función de tres variables. Debemos 
también tener en cuenta el orden en el que aparecen los símbolos dy y dz en la 
integral de superficie, debido a que 

d(Y, Z) _ _ d(Z, Y) 
d(u, v) d(u, v) t 

/ / P dy A dz = —// P dz A dy. 


y por tanto, 
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Con tal notación, la fórmula (12.20) se puede escribir: 

(12.24) JJ F • n dS = JJ P dy A dz + Q dz A dx -f R dx A dy 
s s 

si n = «!. Si n = n 2 la integral de! segundo miembro debe reemplazarse por su 
opuesta. Esta fórmula se parece a ia de las integrales de línea: 

j c F ■ da = j c P dx + Q dy + R dz. 


Si el vector normal unitario n se expresa en función de sus cosenos directores, 
n = cos a i + cos /Sy + cos y k , 

entonces F ■ n = P cos a + Q cos fi + R cos y, y podemos escribir 

JJ F ■ n dS = JJ (P cos a + Q cos /9 + R cos y) dS. 
s s 

Esta ecuación es válida tanto si n = «j comc si.n = n 2 . Los cosenos directores de- 
penderán de la elección de la normal. Si n = n^ podemos utilizar (12.24) para 
escribir 

(12.25) 

JJ (P cos a + Q cos p + R cos y) dS = JJ P dy A dz + Q dz A dx + R dx A dy . 


Si, en cambio, n = n 2 , tenemos 
( 12 . 26 ) 

JJ (P cos a + Q cos /3 + R cos y) dS = — JJ P dy A dz + Q dz A dx + R dx A dy 
s s 

12.10 Ejercicios 

1. Sea S la semiesfera x 2 + y 2 + z 2 = 1, z>0, y F(x, y, z)=xi+yj. Sea n el vector normal 
unitario exterior a S. Calcular el valor de la integral de superficiejf F ndS,e mpleando: 

a) la representación vectorial r(u, n ) = sen u cos v i + sen usenvj + cos u k , 

b) la representación explícita z =^J 1 — x 2 — y 2 . 
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2. Demostrar que el momento de inercia de un recipiente esférico alrededor de un diá- 
metro es igual a § ma-, siendo m la masa del recipiente y a su radio. 

3. Hallar el centro de gravedad de la porción de superficie esférica homogénea 
x- -f y 2 4- z- = a~ situada sobre el primer cuadrante del plano xy. 

4. Sea S la porción de plano limitada por un triángulo de vértices (1,0,0),(0, 1,0), y 

(0,0, 1), y sea F(x,y,z) = xi + vj + zk .Representamos con n la normal unitaria a S 
que tiene componente z no negativa. Calcular la integral de superficie J \ F ■ n dS 
utilizando: N 

a) la representación vectorial r(u, v) = (// + v)i + (u — v)j + (1 — 2 u)k, 

b) una representación explícita de la forma z = f(x, y). 

5. Sea S una superficie paramétrica dada en la forma explícita z = f(x, y), donde ( x,y) 
varía en una región plana T, proyección de S en el plano xy. Sean F =Pi + Qj + Rk 
y n la normal unitaria a S de componente z no negativa. Emplear la representación para- 
métrica r(x,y) = xi + yj +f(x,y)k y demostrar que 

jjr + 


donde P, Q y R están calculadas en (x, y, f(x,y)). 

6. Sea S la misma superftcie del ejercicio 5, y sea <p un campo escalar. Demostrar que 

a) jj <p(x,y, z) dS = Jj <p[x,y,f(x,y)]Jl + ^j + ^j dxdy. 

S T 

b) Jj <f(x, y, z) dy a dz = -Jj* <p[x, y,f(x,y)] j^dxdy. 


0 Jj <p(x,y, z) dz a dx = -JJ <p[x,y,f(x,y)]-^dxdy. 

S T 

7. Si S es la superficie de la esfera x 2 + y 2 + z 2 = a 2 , calcular el valor de la integral de 
superficie 

J J xzdy \dz + yzdz a dx + x 2 dx a dy. 
s 

Elegir una representación para la que el producto vectorial fundamental tenga la direc- 
ción de la normal exterior. 

8. E1 cilindro x 2 + y- = 2x recorta una porción de superftcie S en la hoja superior del 
cono x 2 + y 1 ’ = z 2 . Calcular la integral de superficie 

[f (x*-y 4 + y 2 z 2 - z 2 x 2 + 1 )dS. 


a está cortado por una hoja de un cono 


9. Un recipiênte esférico homogéneo de radio 
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circular recto cuyo vértice está en el centro de la esfera. Si el ángulo en el vértice del 
cono es a, siendo 0 < a < ir, determinar (en función a a y a) el centro de gravedad 
de la porción del recipiente esférico que es interior al cono. 

10. Una hoja de papel rectangular homogénea de base 2 ira y altura h se arrolla formando 
una superficie cilíndrica S de radio a. Calcular el momento de inercia de S alrededor de 
un eje que contiene un diámetro de la base circular. 

11. En relación con el ejercicio 10, calcular el momenlo de inercia de S alrededor de un 
eje situado en el plano de la base y que es tangente al borde circular de la base. 

12. Un flujo de fluido tiene como vector densidad de flujo F(x, y, z) = xi — (2x + y)j +zk. 
Designemos con S el hemisferio x 2 + y 2 + z 2 = 1, z > 0, y con n la normal unitaria 
orientada hacia el exterior de la esfera. Calcular la masa de fluido que atraviesa S en la 
unidad de tiempo en la dirección de n. 

13. Resolver el ejercicio 12 si S contiene también la base plana del hemisferio. En la base 
inferior la normal unitaria es — k. 

14. Sea S la porción del plano x+y+z=t determinada en él por la esfera x 2 +y 2 +z 2 =l. 
Sea <p(x,y,z) = 1 — x 2 — y 2 — z 2 si ( x,y,z) es interior a dicha esfera, y <p(x, y,z) = 0 
en cualquier otro caso. Demostrar que 


J 


<p(x,y,z)dS 



si |f| ^ y/ì, 

si |f| > V 3 - 


[ Indicación. Tomar unos ejes coordenados (*i,yi,zi) con el eje Zi normal al plano 
x + y + z = t. Usar luego coordenadas polares en el plano xiyi como parámetros para S.] 


12.11 Teorema de Stokes 

E1 resto de este capítulo está especialmente dedicado a dos generalizacìones 
del segundo teorema fundamental del Cálculo a las integrales de superficie. Se 
conocen, respectivamente, con las denominaciones de Teorema de Stohes (*) y 
Teorema de la divergencia. Esta sección trata del primero, y en la sección 12.19 se 
expondrá el segundo. 

E1 teorema de Stokes es una extensión directa del teorema de Green el cual 
establece que 


en donde S es una región plana limitada por una curva cerrada C recorrida en 
sentido positivo (contrario al de las agujas del reloj). E1 teorema de Stokes rela- 
ciona una integral de superficie con una integral de línea y puede enunciarse así: 

(*) En honor de G. G. Stokes (1819-1903), matemático irlandés que consiguió contribu- 
ciones fundamentales en la Hidrodinámica y en Ia Úptica. 



Teorema de Stok.es 


535 


teorema 12.3. teorema de stores. Supongamos que S es una superficie 
paramétrica simple regular, S =r(T), siendo T una región del plano uv limitada 
por una curva de Jordan regular a trozos F. (Ver figura 12.12.) Supongamos tam- 
bién que r es una aplicación uno a uno cuyos componentes tienen derivadas par- 
ciales segundas continuas en un cierto conjunto abierto que contenga T u I’. De- 
signemos con C la imagen de r por r, y sean P, Q y R campos escalares derivables 
con continuidad en S. Tenemos entonces 



Figura 12.12 Ejemplo de superficie a la que es aplicable el teorema de Stokes. 


La curva r se recorre en sentido positivo (contrario al de las agujas del reloj) 
y la curva C en el sentido que resulte de aplicar a T la función r. 

Demostración. Para demostrar el teorema basta establecer las tres fórmulas 
siguientes, 


(12.28) 
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l Qdy -!j {~ih dy 

J c *«iZ,JJ(-^ í ÍZA* + |í^A < /z). 

La suma de esas tres ecuaciones nos da la fórmula (12.27) del teorema de Stokes. 
Puesto que las tres son parecidas, tan sólo demostramos la (12.28). 

E1 plan de la demostración consiste en expresar la integral de superficie como 
una integral doble sobre T. Entonces se aplica el teorema de Green para expresar 
la integral doble sobre T como una integral de línea sobre T. Por último, demos- 
tramos que esta integral de línea es igual a fcPdx. 

Escribamos 


r(u, v) = X(u, v)i + Y(u, v)j + Z(u, v)k 


y expresemos la integral de superficie sobre S en la forma 


JJ( 


dP , . , dP , 

— — dx A dy -|- dz 

oy dz 



dPSjxjQ 

B, 3(u, o) dz 8 (u, v) I 


Designemos ahora con p la función compuesta dada por 

p(u, v) = P[X(u, v), Y(u, v), Z(u, a)]. 
E1 último integrando puede escribirse en la forma 


= d_/ dX\ _d_í dX\ 

du \ dv / dv \ du j 

En el ejercicio 13 de la sección 12.13 se dan las directrices de la comprobación 
de (12.29). Aplicando a la integral doble sobre T el teorema de Green obtenemos 


en donde r se recorre en sentido positivo. Parametricemos T mediante una función 
Y definida en un intervalo [a, 6] y sea 


(12.30) 


«(0 = r[ Y (r)] 
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la correspondiente parametrización de C. Expresando entonces cada integral de 
línea en función de su representación paramétrica encontramos que 

[ 31, , dX , f _ , 
p — du + p — dv = P dx, 

J r du dv Jc 

lo cual completa la demostración de (12.28). 

12.12 E1 rotacional y la divergencia de un campo vectorial 

La integral de superficie que aparece en el teorema de Stokes puede expre- 
sarse en forma más sencilla en función del rotacional de un campo vectorial. 
Sea F un campo vectorial derivable dado por 


F(x, y, z) = P(x, y, z)i + Q(x, y, z)j + R(x, y, z)k. 

E1 rotacional de F es otro campo vectorial definido mediante la ecuación 


(12.31) 


e-D- 


Los componentes de rot F son las funciones que aparecen en la integral de su- 
perficie de la fórmula de Stokes (12.27). Por consiguiente, esta integral de super- 
ficie puede ponerse en la forma 

JJ (rot F)-ndS, 

s 

siendo n el vector unitario normai que tiene el mismo sentido que el producto 
vectorial fundamental de la superficie; esto es, 


n 


dr_ dr 
du dv 


II dr dr \ 
| du x dv\ 


La integral de línea en la fórmula de Stokes (12.27) puede ponerse en la 
forma J c F • da., siendo a la representación de C dada por (12.30). Así pues, el 
teorema de Stokes toma la forma más sencilla 


JJ ( rot F) • n í/S = J F ■ da. 
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Para el caso especial en el que S es una región del plano xy y n = k, esta 
fórmula se reduce a 

La ecuación (12.31) que define el rotacional puede recordarse fácilmente 
escribiéndola como un desarrollo de un determinante de tercer orden. 


_ 3 _ _ 3 _ _3 
dx dy 3z 
P Q R 


(dR dQ\. (dP dR\ . , (dO dP\, 

- (âj-£7' + (s " ir) y + fc “ w- 


Este determinante está desarrollado por la primera fda, pero cada «producto» 
como el de 3/3y por R debe interpretarse como la derivada parcial dR/dy. Tam- 
bién podemos escribir esa fórmula como un producto vectorial 

rotF= V x F, 


en donde el símbolo V se maneja como si fuera un vector, 

v-f, + ^ + ±». 

ox oy dz 


Si formamos el «producto escalar» V • F de modo puramente formal, in- 
terpretando otra vez los productos tales como d/dx por P como dPfdx, encontra- 
mos que 


(12.32) 


Vf -r + r + r- 

dx oy oz 


La ecuación (12.32) define un campo escalar llamado divergencia de F, y se escri- 
be div F. 

Ya hemos utilizado el símbolo Vqr para designar el gradiente de un campo 
escalar q , dado por 
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Esta fórmula puede interpretarse como una multiplicación formal del vector sim- 
bólico V por el campo escalar^. Así pues, el gradiente, la divergencia y el rota- 
cional pueden representarse simbólicamente por los tres productos Vr/, V F, y 
V X F, respectivamente. 

Algunos de los teoremas antes demostrados pueden expresarse en función del 
rotacional. Por ejemplo, en el teorema 10.9 se demostró que un campo vectorial 
/„), derivable con continuidad en un conjunto convexo abierto S del 
n-espacio, es un gradiente en S si y sólo si las derivadas parciales de los compo- 
nentes de / satisfacen las relaciones 

(12.33) D k f } (x) = DJ k (x) (j,k= 1,2,...,«). 

En el caso tri-dimensional, el teorema 10.9 puede enunciarse así. 

teorema 12.4. SiF=Pi + Qj + Rkes un campo vectorial derivable con 
continuidad en un conjunto convexo abierto S del espacio de 3 dimensiones, en- 
tonces F es un gradiente en S si y sólo si tenemos 

(12.34) rot F=0 en S. 

Demostración. En el caso tri-dimensional las relaciones (12.33) son equi- 
valentes a la afirmación de que rot F = O. 

12.13 Ejercicios 


En cada ejercicio del 1 al 4, transformar la integral de superficieJJ (;rot F) ■ n dS en 
una integral de línea utilizando el teorema de Stokes, y calcular entonces la integral de línea. 

1. F(x,y, z) = y 2 i + xyj + xzk, donde S es el hemisferio x 2 + y 2 + z 2 = 1, z > 0, y n 
es la normal unitaria con componente z no negativa. 

2. F(x,y, z) = yi + zj + xk, donde S es la parte de paraboloide z = 1 — x 2 — y 2 con 
z > 0, y n es la normal unitaria con componente z no negativa. 

3. F(x,y, z) = (y - z)i + yzj - xzk ,donde S consta de las cinco caras del cubo 0<x<2, 
0 < j < 2, 0 < z < 2 no situadas en el plano xy. n es la normal unitaria exterior. 

4. F(x,y,z) = xzi — yi + x 2 yk, donde S consta de las tres caras no situadas en el 
plano xz del tetraedro limitado por los tres planos coordenados y el plano 3x + y + 3z = 6. 
La normal n es la normal unitaria exterior del tetraedro. 

En los ejercicios del 5 al 10, usar el teorema de Stokes para demostrar que las integra- 
les de línea tienen los valores que se dan. En cada caso, explicar el sentido en el que se 
recorre C para llegar al resultado. 


5. Jc > y dx + z dy + x dz = na 2 f 3, siendo C la curva de intersección de la esfera 
x 2 + y 2 + z 2 = a 2 y el plano x + y + z = 0. 
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6- 5c 0' 4" z ) dx + (z + x) cly + (x + y) dz = 0, siendo C la curva de intersección del 
cilindro x 2 + y 2 = 2y y el plano y = z. 

7. Jc4 2 dx + xydy + xz dz =0, donde C es la curva del ejercicio 6. 

8. Jc (>’ — z)dx + (z — í/y + (x — y)dz = 2-rra{a + 6), donde C es la intersección 
del cilindro x 2 + y 2 = a 2 y el plano x/a + z/b = 1, a > 0, b > 0. 

9- íc (+ 2 + z 2 )dx + (x 2 + z 2 )dy + (x 2 + y 2 ) dz = 2-rrab 2 , siendo C la intersección del 
hemisferio x 2 + y 2 + z 2 = 2 ax, z > 0, y el cilindro x 2 + y 2 = 2 bx, donde 0 < b < a. 

10- Jc (y 2 — z2 ) dx + (z 2 — x 2 ) dy + (x 2 — y 2 ) rfz = 9a 3 /2, donde Ces la curva intersección 
de la superfìcie del cubo0< x <a,0< y <a, 0< z < a y el plano x + y + z = 3a/2. 

11. Si r = xi + yj + zk y Pi + Qj + Rk = a x r, siendo a un vector constante, demos- 
trar que \ c P dx + Q dy + R dz = 2 JJ a ■ n dS, donde C es una curva que limita una 

superficie paramétrica S y n es la normal a S adecuada. 

12. Sea F = Pi + Qj + jRA,donde P = - y/(x 2 + y 1 ), Q = x/(x 2 + y 2 ), R = z. Sea D 
el toro engendrado por la rotación de la circunferencia (x — 2) 2 + z 2 = 1, y = 0, alre- 
dedor del eje z. Demostrar que rotF = O pero que J c . Pdx + Q dy + R dz no es cero 
si la curva C es la circunferencia x 2 + y 2 = 4, z = 0. 

13. Este ejercicio da indicaciones para una demostración de la ecuación (12.29) usada al 
demostrar el teorema de Stokes. 

a) Utilizar la fórmula de la derivación de un producto para probar que 

—( —\_—( ™\_ 3 ‘ p3X 3 P 3X 

duy Sv ) dvy 3u ) du dv dv du 

b) Póngase p(u,v) =P[X(u,v), Y(u,v),Z(u,v)]. Calcular Sp/Su y Sp/dv por medio 
de la regla de la cadena y aplicar la parte a) para deducir la ecuación (12.29), 

-1/ _J7 _ 3P d ( X > y ) SP8(Z,X) 

Su\ P Sv ) Sv\ P Su) ~ Sy S(u,v) + ~3z 8(u, v) ' 


12.14 Otras propiedades del rotacional y de la divergencia 

E1 rotacional y la divergencia de un campo vectorial están relacionados con 
la matriz jacobiana. Si F = Pi + Qj + Rk, la matriz jacobiana de F es 

dP dP~ 
dy dz 
dQ dQ 

d y dz 
dR dR 
dy dz _ 

La traza de esta matriz (la suma de elementos de su diagonal principal) es la diver- 
gencia de F. 
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Toda matriz real A puede escribirse como suma de una matriz simétrica, 
\(A + A ‘) y de una matriz hemi-simétrica, i(A — A*). Cuando A es la matriz 


jacobiana 

DF, la parte hemi-simétrica s 

:e convierte en 




0 

8P 


dP _ 

dR 



dy 

dx 

dz 

dx 

(12.35) 

1 

2 

dQ _ dP 
dx d y 


0 

dz 

dR 

dy 



dR dP 

dR 

_dQ 

0 




_dx dz 

dy 

dz 

_ 


Los elementos no nulos de esta matriz son los componentes de rot F y sus opuestos. 
Si la matriz jacobiana DF es simétrica, cada elemento de (12.35) es cero y 
rot F = O. 

ejemplo 1. Sea F(x,y, z) — xi + yj + zk. Tenemos entonces 

P(x,y,z) = x, Q(x,y,z)=y, R(x,y,z) = z, 
y la matriz jacobiana correspondiente es la matriz idéntica de orden 3X3. Por 
lo tanto 

div F = 3 y rot F = O. 

En general, si F(x,y, z) =f(x)i + g(y)j + h(z)k,ìa matriz jacobiana tiene los ele- 
mentos f(x), g'(y), h'(z) en la diagonal principal y ceros los restantes elementos, 
así que 


div F = f'(x) + g'(y) + h'(z) y rot F = O 

ejemplo 2. Sea F(x,y, z) = xy 2 z 2 i + r 2 sen yj + x 2 e v k. La matriz jacobia- 
na es 

~y 2 z 2 2xyz 2 2xy 2 z ~ 

0 z 2 cos y 2z seny . 

2xe v x 2 e v 0 

Por lo tanto, 

div F = y 2 z 2 + z 2 cos y 

y 

rot F = (x 2 e v — 2zseny)i + (2 xy 2 z — 2xe v )j — 2xyz 2 k. 
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ejemplo 3. Divergencia y rotacional de un gradiente. Supongamos que 
F es un gradiente, sea F = grad <p = d<p/dxi + d<pfdyj + d<p/dz k. La matriz ja- 
cobiana es 


(12.36) 


Por consiguiente, 


d 2 <p 

d 2 <p 

d 2 <p 

d? 

dy dx 

dz dx 

d 2 <p 

d 2 <p 

d 2 <p 

dx dy 

dy 2 

dz dy 

d 2 <p 

d 2 <p 

d 2 <p 

dx dz 

dy dz 

d? _ 


d 2 <p d*<p 
dy 2 dz 2 


La expresión del segundo miembro se llama laplaciana de <p y a menudo se re- 
presenta con el símbolo V z «jp. Así pues, la divergencia de un gradiente V<p es la 
laplaciana de <p. Simbólicamente esto se expresa poniendo 

(12.37) div (Vçp) = V 2 9 ?. 

Cuando V 2 <p= 0, la función <p se llama armónica. La ecuación (12.37) hace ver 
que el gradiente de una función armónica tiene divergencia nula. Cuando las 
derivadas parciales mixtas que aparecen en la matriz (12.36) son continuas, la 
matriz es simétrica y rot F es cero. Es decir, 

rot (grad <p) = 0 

para todo campo escalar <p con derivadas parciales segundas mixtas continuas. 
Este ejemplo demuestra que rot F = O es condición necesaria para que un campo 
vectorial F derivable con continuidad sea un gradiente. Dicho de otro modo, si 
rot F ¥ O en un conjunto abierto S, entonces F no es un gradiente en S. Sabe- 
mos también, según el teorema 12.4 que si rot F = O en un conjunto convexo 
abierto S, entonces F es un gradiente en S. Un campo con rotacional nulo se llama 
irrotacional. 

ejemplo 4. Campo vectorial con divergencia y rotacional nulos. Sea S el 
conjunto de todos los puntos (x, y) ¥= (0, 0), y pongamos 
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si (x, y) e S. Según el ejemplo 2 de la sección 10.16 sabemos que F no es un 
gradiente de S (si bien F es un gradiente en todo rectángulo que no contenga 
el origen). La matriz jacobiana es 


2xy y 2 ~ x 2 
(x 2 + /) 2 (x 2 + /) 2 


0 


DF(x, y) = 


(x 2 + y 2 ) 2 (x 2 + y 2 f 


0 

0 _ 


y vemos al momento que div F = 0 y rot F = O en S. 

ejemplo 5. Divergencia y rotacional de un rotacional. Si F = Pi + Qj + Rk, 
el rotacional de F es un nuevo campo vectorial y podemos calcular su divergencia 
y su rotacional. La matriz jacobiana de rot F es 


' d 2 R 

d 2 Q 

d 2 R 

d 2 Q 

d 2 R 

d 2 Q ~ 

dx dy 

dx dz 

dy 2 

dy dz 

dz dy 

dz 2 

d 2 P 

d 2 R 

d 2 P 

d 2 R 

d 2 P 

d 2 R 

dx dz 

dx 2 

dy dz 

dy dx 

dz 2 

dz dx 

d 2 Q 

d 2 P 

d 2 Q 

d 2 P 

d 2 Q 

d 2 p 

_ dx 2 

dx dy 

dy dx 

dy 2 

dz dx 

dz dy_ 


Si suponemos que todas las derivadas parciales mixtas son continuas, encontra- 
mos que 

div ( rot F) = 0 

y 

(12.38) rot (rot F) = grad (div F) — V 2 / - , 

estando defmida V 2 /"mediante la ecuación 

V 2 F = (V 2 P)i + (V 2 0/ + (V 2 R)k. 

La identidad (12.38) relaciona los cuatro operadores, gradiente, rotacional, diver- 
gencia y laplaciana. En el ejercicio 7 de la sección 12.15 se propone la comproba- 
ción de (12.38). 

E1 rotacional y la divergencia tienen algunas propiedades generales análogas 
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a las de las derivadas ordinarias. En primer lugar, son operadores lineales. Esto 
es, si a y b son constantes, tenemos 


(12.39) div (aF + bG) = a div F + b div G, 

y 

(12.40) rot ( aF + bG) = a rot F + b rot G. 

También poseen la propiedad análoga a la fórmula de la derivación de un pro- 
ducto: 

(12.41) div (<pF) = <p àiv F + V<p • F, 

y 

(12.42) rot ( cpF) = <p rotF + V 95 x F, 

donde cp es cualquier campo escalar derivable. Estas propiedades son consecuencias 
inmediatas de las defmiciones de rotacional y divergencia; sus demostraciones se 
proponen en el ejercicio 6 de la sección 12.15. 

Si empleamos el vector simbólico 


V = f Ì + í J + ì k 

ox oy oz 


una vez más, cada una de las fórmulas (12.41) y (12.42) toma una forma muy 
parecida a la regla de la derivación de un producto: 


y 


V • ( <pF) = <pV • F + Vç> • F 
V x ( <pF ) = çpV x F + V<p x F. 


En el ejemplo 3 la laplaciana de un campo escalar, V 2 ^, se defìnió como 
d 2 <pjdx 2 + d 2 <p/dy 2 +d 2 <p/dz 2 .En el ejemplo 5 la laplaciana V 2 F de un campo vec- 
torial se definió por medio de los componentes. Obtenemos fórmulas correctas 
para V 2 <p y para V 2 + si interpretamos V 2 como el operador simbôlico 
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Esta fórmula para V 1 2 3 4 5 6 7 8 también resulta por multiplicación interior del vector simbó- 
lico V por sí mismo. 

Así, tenemos V 2 = V • V y podemos escribir: 

V 2 r/, = (V • V)ç. y V 2 F = (V • V)f. 

Consideremos ahora la fórmula V • V</. Ésta puede interpretarse como (V • V)f/, 
que es V 2 </; o como V • (Vy), que es div (V</). En el ejemplo 3 se demostró que 
div (Vr/) = V 2 f/ , así tenemos. 


(V • V)</ = V • (V</); 

luego podemos escribir V • V</ para una u otra de esas expresiones sin peligro de 
ambigtiedad. Esto no es cierto, sin embargo, cuando q se sustituye por un campo 
vectorial F. La expresión (V • V)f es V 2 F, que ha sido defmida. No obstante, 
V • (VF) no tiene significado a causa de que VF no está definido. Por lo tanto, 
la expresión V • VF tiene significado únicamente cuando se interpreta como 
(V • V)F. Estas observaciones hacen ver que si bien las fórmulas simbólicas 
sirven algunas veces como notación manejable y mnemotécnica, es preciso utili- 
zarlas con mucha precaución. 

12.15 Ejercicios 


1. Para cada uno de los siguientes campos vectoriales determinar la matriz jacobiana y 
calcular el rotacional y la divergencia 

a) F(x,y, z) = (x 2 + yz)i + (y 2 + xz)j + (z 2 + xy)k. 

b) F(x,y, z) = (2z - 3 y)i + (3x - z)j + (y - 2x)k. 

c) F(x,y, z) = (z + sen ý)i - (z - xcos y)j. 

d) F(x, y, z) = e x,J i + cos xyj + cos xz 2 k. 

e) F(x, y, z) = x 2 sen y i + y 2 sen xz j + xy sen (cos z)k. 

2. Si r = xi + yj + zk y r = ||r||, calcular rot [f(r)r], siendo / una función derivable. 

3. Sir = xi + yj + zk y A es un vector constante, demostrar que rot (A x r) = 2A. 

4. Sir = xi + yj + zky r = ||rj| , hallar todos los valores de n para los que(r"r) = 0. 

5. Hallar un campo vectorial cuyo rotacional es xi + yj + zk o demostrar que no existe 
un tal campo vectorial. 

6. Demostrar las propiedades elementales del rotacional y de la divergencia expresada en 
las ecuaciones de la (12.39) a la (12.42). 

7. Demostrar que rot(rot F) = grad(div F) - V 2 F si los componentes de F tienen derivadas 
parciales mixtas de segundo orden continuas. 

8. Demostrar la identidad 

V • (F x G) = G • (V X F) - F ■ (V x G), 
donde F y G son campos vectoriales diferenciables. 
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9. Un campo vectorial F no será gradiente de un potencial a menos que rot F = O. 
No obstante, es posible encontrar un campo escalar no nulo /i tal que 11F es un gra- 
diente. Demostrar que si un tal /i existe, F es siempre perpendicular a su rotacional. 
Cuando el campo es bidimensional.f = Pi + Qj,e ste ejercicio nos da una condición 
necesaria para que la ecuación diferencial P dx + Q dy = 0 posea un factor integrante. 
(E1 recíproco también es cierto. Esto es, si f.rotf=0 en una región conveniente, 
existe un /t no nulo tal que /iF es un gradiente. La demostración del recíproco no 
se pide.) 

10. Sea F(x,y, -) = \rï 2 i + z~x-j + x-y~k . Demostrar que rot F no es siempre cero, pero 
que F .rot F= 0. Hallar un campo escalar /i tal que /iF sea un gradiente. 

11. Sea V(x, l') = v'7 + a 'j , donde c es una constante positiva, y sea r(x, p) = xi + \ j. 
Consideremos una región plana R bordeada por una curva de Jordan regular a trozos C. 
Calcular div (K x r) y rot (V x r) y aplicando el teorema de Green demostrar que 


j c V x r ■ da = 0, 

donde ot es la función que describe C. 

12. Demostrar que el teorema de Green puede expresarse en la forma 

JJ (rot V) ■ k dx dy = J> V • T ds, 

R C 

donde T es el vector unitario tangente a C y s es la longitud de arco. 

13. Una región plana R está limitada por una curva de Jordan regular a trozos C. Se cono- 
cen los momentos de inercia de R alrededor de los ejes x e y que valen respectivamente 
a y b. Calcular la integral de línea 

j c V(r*) nds 

en función de a y b. En esta integral, r = \\xi + yj\\, n representa el vector unitario 
normal exterior a C y s es la longitud de arco. La curva se recorre en sentido contrario 
al de las agujas del reloj. 

14. Sea F un campo vectorial bidimensional. Dar una deftnición de Ia integral de línea 
Í C F * da. Esa defmición debe ser tal que pueda obtenerse como consecuencia del 
teorema de Green la fórmula siguiente: 

j F xda=k J’J (div F)dxdy, 

C B 

siendo R una región plana limitada por una curva cerrada simple C. 

* 12.16 Reconstrucción de un campo vectorial a partir de su rotacional 

A1 estudiar el gradiente hemos aprendido a determinar si un campo vectorial 
dado es o no un gradiente. Consideramos ahora la cuestión análoga relativa al rota- 
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cional. Dado un campo vectorial F, «Lhay un G tal que rot G = F? Supongamos 
que F = Pi + Qj + Rk y G =Li + Mj + Nk. Para resolver la ecuación rot G = F 
tenemos que resolver el sistema de ecuaciones diferenciales en derivadas parciales 


(12.43) 


d_N_d_M = p = 0 d M. _ d ± 

dy dz dz dx ’ dx dy 


en las que P, Q y R son conocidas y L, M, N son las funciones incógnitas. 

No siempre es posible resolver tal sistema. Por ejemplo, se demostró en la 
sección 12.14 que la divergencia de un rotacional es siempre cero. Por tanto, para 
que el sistema (12.43) tenga solución en un cierto conjunto abierto S es nece- 
sario que 


(12.44) 


?£ + S2 + «« = o 

dx dy Sz 


en todo S. Esta condición es también suficiente si restringimos convenientemente 
el conjunto S en el que se verifica (12.44). A continuación demostramos que la 
condición (12.44) es suficiente cuando S es un intervalo tridimensional. 


teorema 12.5. Si F es derivable con continuidad en un intervalo abierto 
S de E 3 , entonces existe un campo vectorial G tal que rot G = F si y sólo si 
div F = 0 en todo S. 


Demostración. La necesidad de la condición div F = 0 ha sido ya estableci- 
da, puesto que la divergencia de un rotacional siempre es cero. Para establecer 
la suficiencia tenemos que encontrar tres funciones L, M, y N que satisfagan las 
tres ecuaciones (12.43). Intentemos resolver el problema tomando L — 0. Enton- 
ces la segunda y tercera ecuaciones (12.43) se transforman en 


dN 

dx 


-Q 


y 


Esto indica que debe ser:: 

N(x, y, zj = —J^ Q(t, y, z) dt +f(y, z) 


M(x, y, z) = J* R(t, y, z) dt + g(y, z), 

donde cada integración se efectúa a lo largo de un segmento rectilíneo contenido 
en S y las «constantes de integración» f(y, z) y g(y, z) son independientes de x. 
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Para hallar una solución hagamos f(y,z ) = 0. La primera ecuación (12.43) exige 


(12.45) = 

dy dz 

Según la elección de M y N que se ha indicado tenemos: 

< ' 2 ■ 46, fy- " -bfj*-»** - S - Ï- 

Seguidamente permutamos las dos operaciones de derivación parcial e inte- 


gración aplicando el teorema 10.8. Esto es, escribimos: 

(12.47) 

J z ) dt = 

í £>2 Q(t,y, z)dt 

JXq 

y 



(12.48) 

í R(U y, z) dt = 
OZ Jx o 

p£> 3 l?(í, y, z) dt. 

Con ello la ecuación (12.46) se convierte 

en 


(12 49) jj-orf».)’.* 

En virtud de la condición (12.44) podemos reemplazar el integrando de (12.49) 
por DyPit, y, z); la ecuación (12.49) toma la forma 

fy - fz - Z) * - Ï - «*■ >■ 2) - **■>■ * ~ Î■ 

Por consiguiente, (12.45) se satisfará si elegimos g de modo que 9g/3z = 
= —P(x 0 ,y,z). Así, por ejemplo, podemos tomar 

g (y, z) = —/* P(x 0 , y, u ) du. 


Este razonamiento nos lleva a considerar el campo vectorial G = Li + Mj + Nk, 
donde L(x, y, z) = 0 y 

M(x, y, z) = J/ J?(t, z) dt — /* P(x 0 , it) du, N(x, y, z) = — J* Q(t, y, z) dt. 
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Con estas tres funciones L, M y N es fácil comprobar, por medio de (12.47) y 
(12.48), que se satisfacen las tres ecuaciones (12.43), obteniendo rot G = F, como 
deseábamos. 

Debe observarse que la demostración precedente no sólo establece la exis- 
tencia de un campo vectorial G cuyo rotacional es F, sino que también propor- 
ciona un método directo para determinar G por medio de integrales calculadas 
con los componentes de F. 

Para una F dada, el campo vectorial G que hemos construido no es la única 
solución de la ecuación rot G = F. Si sumamos a G cualquier gradiente derivable 
con continuidad V <f obtenemos otra solución ya que 


rot (G + Vç) = rot G + rot (V^) = rot G = F, 

puesto que rot (V </) = O. Además, es fácil demostrar que todas las soluciones 
derivables con continuidad deben ser de la forma G + V <f. En realidad, si H 
es otra solución, entonces rot H = rot G ,de manera que rot (H - G) - O. Se- 
gún el teorema 10.9 resulta que H - G = V q para algún gradiente derivable 
con continuidad V </ ; luego H = G + Vq:, como se afirmó. 

Un campo vectorial F para el que div F = 0 suele llamarse solenoidal. E1 
teorema 12.5 establece que un campo vectorial es solenoidal en un paralelepípedo 
rectangular abierto S si, y sólo si, es el rotacional de otro campo vectorial en S 

E1 ejemplo que sigue demuestra que esta afirmación no es válida para con- 
juntos abiertos cualesquiera. 

ejemplo. Un campo vectorial solenoidal que no es un rotacional. Sea D la 
parte de E 3 comprendida entre dos esferas concéntricas de centro en el origen 
y radios a y b, siendo 0 < a < b. Sea V = r/r 3 , donde r = xi + yj + zk 
y r = ||r ||. Es fácil comprobar que div V = 0 en todo D. En efecto, tenemos la 
fórmula general 


div (r”r) = (n + 3)r n , 

y en este ejemplo n = — 3. Usaremos el teorema de Stokes para demostrar que 
V no es un rotacional en D (si bien lo es en todo intervalo tridimensional abierto 
que no contenga el origen). Para ello supongamos que existe un campo vectorial 
U tal que V = rot U en D y llegamos a una contradicción. Según el teorema 
de Stokes podemos escribir 


JJ (rot U) ■ n dS = j> c U • da. 


(12.50) 
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Figura 12.13 La superjicie S y la curva C íle la ecuación (12.50). 

donde S y C son la superfice y la curva dibujada en la figura 12.13. Para cons- 
truir S, tomamos una superficie esférica de radio R concéntrica con las fronteras 
de D, siendo a < R < b, y quitamos un pequeno casquete polar como se indica 
en la figura. La parte que queda es la superficie S. La curva C es el borde circular 
dibujado. Representemos con n la normal unitaria exterior a S, de modo que 
n = r/r. Puesto que rot U = V = r/r 3 , tenemos 

(rot V)-n = - - = - 
r r r 

Sobre la superficie S este producto vectorial tiene el valor constante 1 /R 2 . Por lo 
tanto, tenemos, 

s s 

Cuando el casquete polar degenera en un punto el área de S tiende a 4-R 2 (área 
de toda la esfera) y por consiguiente, el valor de la integral de superficie (12.50) 
tiende a 4-n-. 

Examinemos seguidamente la integral de línea de (12.50). Es fácil demostrar 
que para toda integral de línea / c U ■ da. tenemos la desigualdad 

| j c V ■ da | < M • (longitud de C) 

donde M es una constante que depende de U. (En efecto, M puede tomarse como 
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el máximo de ||t/||en C).Por consiguiente, al reducir el casquete polar a un punto, 
la longitud de C y el valor de la integral de línea tienden ambos a cero. Llegamos 
así a una contradicción; la integral de superficie (12.50) tiende a 4 t t, y la corres- 
pondiente integral de línea a la que es igual tiende a 0. Luego no puede existir 
en la región D una función U cuyo rotacional sea V . 

La dificultad aquí es debida a la estructura geométrica de la región D. Si bien 
esta región es simplemente conexa (esto es, toda curva cerrada simple en D es el 
borde de una superficie paramétrica contenida totalmente en D) existen superfi- 
cies cerradas en D que no son frontera completa de un sólido contenido entera- 
mente en D. Por ejemplo, ninguna esfera que incluya el origen es la frontera 
completa de un sólido enteramente contenido en D. Si la región D tiene la pro- 
piedad de que toda superficie cerrada contenida en D es la frontera de un sólido 
enteramente contenido en D, puede demostrarse que existe un campo vectorial 
U tal que V — rot U en D si, y sólo si, div V = 0 en toda región D. La de- 
mostración es difícil y no la daremos aquí. 

* 12.17 Ejercicios 


1. Hallar un campo vectorial G(x,y,z) cuyo rotacional es 2/ + j + 3ken todo £3. iCuál 
es el campo vectorial derivable con continuidad del tipo más general con esa propiedad? 

2. Demostrar que el campo vectorial F(x,y, z) = (y — z)i + (z — x)j -f (x — y)k es so- 
lenoidal, y hallar un campo vectorial G tal que F = rot G 

3. Sea F(x,y,z) = — zi + xyk. Hallar un campo vectorial derivable con continuidad G 
de la iormaG(x,y,z)=L(x,y,z)i+M(x,y,z)jtal que F =rot G en todo paralelepípedo 
rectangular de £3. iCuál es el G más general de esa forma? 

4. Si dos campos vectoriales U y V son irrotacionales, demostrar que el campo vectorial 
U x Ves solenoidal. 

5. Sea r = xi + yj + zk y r = ||r||. Demostrar que n = — 3 es el único valor de n para el 
que r”r es solenoidal siendo r + 0. Para este n, elegir un paralelepípedo S que no con- 
tenga el origen y expresar r~ 3 r como un rot en S. [Advertencia. Si bien r~ s r es un rota- 
cional en cualquier S de este tipo, no lo es en el conjunto de todos los puntos distintos 
del (0,0,0)]. 

6. Encontrar la forma más general de una función / derivable con continuidad y de una 
sola variable real tal que el campo vectorial f(r)r sea solenoidal, donde r = xi + yj + 
+ zk y r =' ||r[|. 

7. Sea V un campo vectorial derivable con continuidad en cierto paralelepípedo rectan- 
gular S de £3. Consideremos las dos afìrmaciones siguientes relativas a V: 

(I) rot V = O y V = rot U para algún campo vectorial U derivable con continuidad 
(en todo S). 

(II) Existe un campo escalar <p tal que V<p es derivable con continuidad y 

V = grad <p y V 2 çi = 0 en todo S. 

a) Demostrar que (1) implica (11). Dicho de otro modo, un campo vectorial que es a la 
vez irrotacional y solenoidal en S es el gradiente de una función armónica en S. 

b) Demostrar que (11) implica (1), o dar un contraejemplo. 
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8 . Supongamos todos los campos vectoriales que se consideren derivables con continuidad. 
Sea H = F + G, donde F es solenoidal y G irrotacional. Existe entonces un campo 
vectorial U tal que F = rot í/y un campo escalar tp tal que G = V <p en S. Demostrar 
que U y <p satisfacen en S la siguiente ecuación diferencial en derivadas parciales: 

V 2 <P = div H, grad (div U) - V 2 i/ = rot H. 

Observaciórt. Este ejercicio es de gran utilidad, a causa de que puede demostrar- 
se que todo campo vectorial H derivabìe con continuidad en S puede expresarse en la 
forma H = F + G donde F es solenoidal y G irrotacional. 

9. Sea H(x,y,z) = x 2 yi + y 2 zj + z 2 xk. Hallar los campos vectoriales F y G, donde F 

es un rotacional y G un gradiente, de modo que se verifique H = F + G. 

10. Sean u y v dos campos escalares derivables con continuidad en un intervalo abierto 

de Ê 3 . 

a) Demostrar que existe un campo vectorial F tal que Vm X Vv = rot F en todo R. 

b) Determinar si cualquiera de los tres campos vectoriales siguientes pueden o no ser 

utilizados como F en la parte a): i) V(mv); ii) mVv; iii) vVm. 

c) Si u(x, y,z) = x 3 — y 3 + z 3 y v(x, y, z) = x + y + z, calcular la integral de superficie 

JJ Vm x Vv ■ ndS, 
s 

en donde S es la semiesfera x 2 + y 2 + z 2 = 1, z > 0, y n es la normal unitaria con 
un componente z no negativo. 

12.18 Extensiones del teorema de Stolces 

E1 teorema de Stokes puede extenderse a superficies regulares simples más 
generales. Si T es una región múltiplemente coriexa parecida a la de la figura 


v z 



Fiuuha 12.14 Exiensiún del teorema de Stokes a superjicies que son imágenes uno a uno 
de regiones múltiplemente conexas. 
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12.14 (con un número finito de agujeros), la imagen uno a uno S = r{T) conten- 
drá el mismo número de agujeros que T. Para extender el teorema de Stokes a 
tales superficiales seguiremos el mismo tipo de razonamiento que en la demostra- 
ción precedente, excepto que usaremos el teorema de Green para regiones múlti- 
plemente conexas (teorema 11.12). En lugar de la integral de línea que aparece 
en (12.27) precisamos una suma de integrales de línea, con signos adecuados, to- 
madas sobre las imágenes de las curvas que constituyen la frontera de T. Por 
ejemplo, si T tiene dos agujeros, como en la figura 12.14, y las curvas frontera 
F, r, y r 2 son recorridas en la dirección indicada, la identidad del teorema de 
Stokes toma la forma 

JJ ( rot F) - ndS = j> c F- dp + j c ^F ■ dp^ + j^F-dp^, 

donde C, y C 2 son las imágenes de T, I\ y r 2 respectivamente, y p, pi y p 2 
son las funciones compuestas p(í) = i-[y(0]» Pi(0 = »'[ïi(0]. P Ât) = ** ty 2 (í)]- 
Las funcionesy , Yi y y 2 son las que describen T, T, y r 2 en las direcciones indn 
cadas. Las curvas C, C, y C 2 serán recorridas en las direcciones inducidas por la 
aplicación r a partir de T, Tj y T 2 . 

E1 teorema de Stokes puede también extenderse a algunas superficies regula- 
res no simples (pero no a todas). Veamos algunos ejemplos 

Consideremos primero el cilindro dibujado en la figura 12.15. Es la reunión 
de dos superficies paramétricas regulares simples S x y S 2) imágenes de dos rec- 
tángulos adyacentes 7\ y T 2 a través de las aplicaciones r^ y r 2 , respectivamente. 
Si Yi describe la frontera r 1( positivamente orientada, de T r y y 2 la frontera r a 
de T 2 asimismo orientada positivamente, las funçiones p^ y p 2 definidas por 

Pi(0 = »-i[Yi(0]. P 2 (0 = '■ztYzíO] 


describen las imágenes Ci y C 2 , de F, y r 2 respectivamente. En este ejemplo las 
representaciones r^ y r 2 pueden elegirse de modo que estén de acuerdo en la inter- 
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sección I\ n V 2 . Si aplicamos el teorema de Stokes a cada parte S, y S 2 y suma- 
mos las dos identidades, obtenemos: 

(12.51) JJ (ro.t F)-n 1 dS + JJ(rot F) ■ n z dS = F ■ + J^ F ■ dp t , 

Si ' St 

donde y n 2 son las normales determinadas por los productos vectoriales de 
»*! y r 2 , respectivamente. 

Representemos con r la aplicación de 7\ U T 2 que coincide con r x en T 1 
y con r 2 en T 2 , y sea n la correspondiente normal unitaria determinada por el 
producto vectorial fundamental r. Ya que las normales /t, y n 2 coinciden en direc- 
ción en n S 2 , n es igual a n^ en Si e igual a n 2 en S 2 . Por consiguiente, la 
suma de las integrales de superficie del primer íhiembro de (12.51) es igual a 

JJ (rot F)-ndS. 

SivS2 

En este ejemplo, las representaciones r x y r 2 pueden elegirse de modo que pi y p 2 
determinen direcciones opuestas en cada arco de la intersección C x O C 2 , como 
indican las flechas en la figura 12.15. Las dos integrales de línea del segundo 
miembro de (12.51) pueden reemplazarse por una suma de integrales de línea a 
lo largo de las dos circunferencias C\ y C\ que forman el borde superior e infe- 
rior de Sj U S 2 , puesto que las integrales de línea a lo largo de cada arco de la 
intersección C x n C 2 se reducen. Por lo tanto, la ecuación (12 51) puede escri- 
birse en la forma 


(12.52) jj (rot F) ndS = J^ F ■ dp x + J^ F ■ dp 2 , 


donde las integrales de línea se calculan en las direcciones deducidas de las de 
Tj y r 2 . Las dos circunferencias C'i y C' 2 forman la frontera completa de Sj U S 2 . 
La ecuación (12.52) expresa la integral de superficie de (rot F) ■ n sobre S^ u S 2 
como una integral de línea sobre ia frontera completa de S t U S 2 . Esa ecuación 
es la extensión del teorema de Stokes a un cilindro. 

Supongamos ahora que aplicamos los mismos conceptos a la superficie dibu- 
jada en la figura 12.16. Esta superficie es también la reunión de dos superficies 
paramétricas regulares simples S, y S 2 , imágenes de dos rectángulos adyacentes 
T, y r 2 . Esta superficie especial se llama banda de Mòbius{*)\ se puede construir 


(*) De A. F. Mòbius (1790-1868), discípulo de Gauss. A ia edad de 26 anos fue desig- 
nado profesor de Astronomía en Leipzig, cargo que desempeiió hasta su muerte. Trabajó en 
Mecánica celeste, pero sus investigaciones más importantes versaron sobre temas de Geometría 
y de Teoría de números. 
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Figura 12.16 Banda de Môbius considerada como la reunión de dos superficies paramétricas 
simples. El teorema de Stokes no se extiende a una banda de Mòbius. 


fácilmente un modelo con una tira rectangular de papel dando a uno de los extre- 
mos una media vuelta y soldando los dos bordes. Definimos p^, p 2 , Cj y C 2 para 
la banda de Mòbius como antes se hizo para el cilindro. E1 borde de S\ u S 2 en 
este caso es una curva cerrada simple C', y no dos. Esta curva es el borde comple- 
to de la banda de Môbius. 

Si aplicamos el teorema de Stokes a cada una de las partes S x y S 2 como se 
hizo para el cilindro, obtenemos la ecuación (12.51). Pero si intentamos mantener 
las dos integrales de superficie y las dos integrales de línea como antes, nos encon- 
tramos con dos dificultades. Primera, las dos normales n x y n 2 no coinciden en 
dirección en toda la intersección Cj n C 2 . (Véase figura 12.16.) Por consiguiente, 
no podemos definir una normal n para toda la superficie tomando » = n, en S t 
y n = n 2 en S 2 , como hicimos en el cilindro. Esto no es grave inconveniente, no 
obstante, ya que podemos definir n = n^ en S, y en Cj n C 2 , y definir entonces 
n = n 2 en el resto. Esto nos da una normal discontinua, pero las discontinuidades 
así introducidas constituyen un conjunto de medida nula en el plano uv y no 
afectan la existencia o el valor de la integral de superficie 

// ( rot F) ndS. 

ShjS, 

Una dificultad más seria encontramos al intentar mantener las integrales de 
línea. En este ejemplo no es posible elegir las aplicaciones r x y r 2 de manera que 
pi y p 2 determinen direcciones opuestas en cada uno de los arcos de la intersec- 
ción Q n C 2 . Esto se indica con flechas en la figura 12.16, uno de esos arcos es 
recorrido dos veces en la misma dirección. Sobre este arco las correspondientes 
integrales de línea no se reducirán necesariamente como ocurrió en el cilindro. Por 
consiguiente, la suma de las integrales de línea de (12.51) no son necesariamente 
iguales a la integral de línea sobre la frontera completa de u S 2 , y el teorema 
de Stokes no puede extenderse a la banda de Môbius. 
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Observación. E1 cilindro y la banda de Môbius son ejemplos de superficies orien- 
tables y no orientables, respectivamente. No intentaremos definir estos conceptos con 
precisión, pero mencionaremos algunas de sus diferencias. Para una superficie orienta- 
ble S, U Si formada con dos superficies paramétricas regulares simples como las des- 
critas antes, las aplicaciones r x y r 2 pueden siempre elegirse de modo que Pi y P2 
determinen direcciones opuestas sobre cada arco de la intersección Ci n C2. Para 
una superficie no orientable no es posible tal definición de normal. Un modelo en 
papel de una superficie orientable siempre presenta dos caras que pueden distinguirse 
pintándolas con dos colores diferentes. Las superficies no orientables tienen tan 
sólo una cara. Para hacer un estudio riguroso de éstas y otras propiedades de las 
superficies orientables y no orientables, puede consultarse cualquier libro de Topo- 
logía combinatoria. E1 teorema de Stokes puede extenderse a las superfìcies orienta- 
bles mediante un procedimiento parecido al seguido antes para el cilindro. 


Otra superficie orientable es la esfera dibujada en la figura 12.17. Es la 
reunión de dos superficies paramétricas simples (hemisferios) S, y S 2) que pueden 
considerarse imágenes de un disco circular del plano xy a través de las aplicacio- 
nes r t y r 2 , respectivamente. Damos a r, pi, p 2) Ci, C 2 el mismo significado que 
en los ejemplos anteriores. En este caso las curvas C t y C 2 están identificadas 
por la aplicación r (coinciden a lo largo del ecuador), y la superficie S x u S 2 
se Ìlama cerrada. Además, «j y n 2 pueden elegirse de modo que las direcciones 
determinadas por p* y p 2 sean opuestas en C t y C 2) como se indica con flechas 
en la figura 12.17. (Esto ocurre porque S t u S 2 es orientable.) Si aplicamos el 



Figura 12.17 Extensión del teorema de Stokes a una esfera. 


teorema de Stokes a cada hemisferio y sumamos los resultados obtenemos la 
ecuación (12.51), como antes. Las normales /ij y n 2 coinciden en la intersección 
Ci n C 2 , y podemos reunir ias integrales sobre Si y S 2 en una sobre toda la esfera. 
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Las dos integrales de linea del segundo miembro de (12.51) se reducen, y nos 
queda la fórmula 


JJ ( rot F)- ndS = 0. 


Esto es válido no tan sólo para una esfera, sino para toda superficie orientable 
cerrada. 


12.19 Teorema de la divergencia (teorema de Gauss) 

E1 teorema de Stokes expresa una relación entre una integral extendida a una 
superficie y una integral de línea tomada sobre la curva o curvas que constituyen 
la frontera de tal superficie. E1 teorema de la divergencia expresa una relación 
entre una integral triple extendida a un sólido y una integral de superficie tomada 
sobre la frontera de ese sólido. 

TEOREMA 12.6. TEOREMA DE LA DIVERGENCIA. Si V es UH SÓlÌdo en £3 
limitado por una superficie orientable S, si n es la normal unitaria exterior a S 
y si F es un campo vectorial definido en V, entonces tenemos 

(12.53) /// (div F) dx dy dz = j j F ■ n dS. 


Observación. Si expresamos F y n en función de sus componentes 
F(x,y,z) = P(x, y, z)i + Q(x, y, z)j + R(x, y, z)k 

y 

n = cos a i + cos pj + cos 7 k, 
la ecuación (12.53) puede entonces ponerse en la forma: 

(12.54) JJJJ^ + dx d y dz = JJ(£cosa + Q cos p + R cos 7) dS . 

V s 

Demostración. Bastará establecer las tres ecuaciones 
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\\\f/ xdydz 

\\\ d i dxdydz 

v 


= \\ 


Q cos P dS, 



s 


y sumar los resultados para obtener (12.54). Comenzamos por la tercera de esas 
fórmulas y la demostramos para sólidos de tipo ciertamente especial. 

Supongamos que V es un conjunto de puntos (jc, y, z) que satisfacen una re- 
lación de la forma 


g(x, y)<,z< f(x, ỳ) para (x, j) en T, 

siendo T una región conexa del plano xy, y / y g funciones continuas en T, con la 
condición g(x, y) ^ f(x, y) para cada punto (x, y) en T. Geométricamente, esto 
significa que T es la proyección de V en el plano xy. Toda recta paralela al eje z 
que atraviese T corta al sólido V a lo largo de un segmento rectilíneo que une 
la superficie z = g(x, y) a la z = f(x, y). La superficie frontera S consta de un 
casquete superior S u dado en la forma explícita z = f(x, y); otro inferior S 2 dado 
por z = g(x, y); y en algunos casos por una porción de cilindro S 3 engendrado por 
una recta que se mueve a lo largo de la frontera de T manteniéndose paralela al 
eje z. La normal exterior a S tiene componente z no negativa en Sj y no positiva 
en S 2 y es paralela al plano xy en S 3 . Los sólidos de este tipo se llaman «proyec- 
tables-xy». (En la figura 12.18 se muestra un ejemplo.) En él se incluyen todos 



Figura 12.18 Ejemplo de sólido proyectable-xy. 
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los sólidos convexos (por ejemplo, esferas, elipsoides, cubos) y otros muchos que 
no son convexos (por ejemplo, el toro con eje paralelo al z). 

La idea de la demostración es sencillísima. Expresamos la integral triple como 
una doble extendida a la proyección T. Entonces demostramos que esta integral 
doble tiene el mismo valor que la integral de superficie citada en el enunciado. 
Comencemos con la fórmula 

/íf af ix iy iz “ íf LC’" if *] * iy ■ 

V T 

La integral unidimensional respecto a z puede calcularse mediante el segundo teo- 
rema fundamental del cálculo, dándonos 

(:12-55) JJJ dx dy dz = JJ {R[x, y,f(x, y)] - R[x, y, g(x, y)]} dx dy. 

V T 

Para la integral de superficie podemos escribir: 

(12.56) /J R cos y dS = JJ R cos y dS + // R cos y dS + // R cos y dS. 

S Si s, s 3 

Sobre S 3 la normal n es paralela al plano xy, de modo que cos y = 0, y la integral 
sobre S 3 es nula. Sobre la superficie Sj usamos la representación 

r(x,y) = xi + yj +f(x,y)k, 

y sobre S 2 

r(x, ỳ) = xi + yj + g(x, y)k. 

En Si la normal n tiene la misma dirección que el producto vectorial fundamen- 
tal dr/dx x dr/dy, así podemos escribir [véase ecuación (12.25)]: 

// R cos y dS = // R dx A dy = // R[x, y,f(x, y)] dx dy. 

Si S j T 

En S 2 la normal n tiene dirección opuesta a la de drjdx x dr/dy de modo que, en 
virtud de (12.26), tenemos, 

// R cos y dS = —/J R dx A dy= -// R[x, v, g(x, y)] dx dy. 
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Por consiguiente, la ecuación (12.56) se convierte en 


|| R cos y dS = || {R[x, y,f(x,y )] - R[x, y, g(x,y)]} dx dy. 

S T 

Comparando ésta con la (12.55) vemos que 

/// 57 Jx dy dz ~ Sj R cos y ds ' 

En la demostración anterior la hipótesis de que V es proyectable-xy nos per- 
mite expresar la integral triple extendida a V como una integral doble sobre su 
proyección T sobre el plano xy. Es evidente que si V es proyectable-yz podemos 
razonar del mismo modo y demostrar la identidad 

íííf/ xdydz ~íí F ‘ : ° s '“ ls '’ 

v s 

y si V es proyectable-xz obtenemos: 

/íí i? ix iy dz = SS Q cos ** ds ' 

V s 

Así vemos que el teorema de la divergencia es válido para todos los sólidos pro- 
yectables sobre los tres planos coordenados; en particular, para todo sólido 
convexo. 

Un toro con el eje paralelo al eje z es proyectable-xy pero no proyectable-xz 
ni proyectable-yz. Para extender el teorema de la divergencia a ese sólido cortamos 
el toro en cuatro partes iguales por medio de planos que pasan por su eje y para- 
lelos a los planos xz e yz, respectivamente, y aplicamos el teorema a cada una de 
las partes. La integral triple sobre el toro completo es la suma de las integrales 
triples sobre las cuatro partes. Cuando sumamos las integrales de superficie sobre 
las cuatro partes encontramos que las aportaciones de las caras comunes a las 
partes adyacentes se reducen unas con otras, puesto que las normales exteriores 
tienen direcciones opuestas sobre un par de tales caras. Por lo tanto, la suma de 
las integrales de superficie sobre las cuatro partes es igual a la integral de super- 
ficie sobre el toro completo. Este ejemplo hace ver cómo el teorema de la diver- 
gencia puede extenderse a ciertos sólidos no convexos. 
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12.20 Aplicaciones del teorema de la divergencia 

Los conceptos de rotacional y divergencia de un campo vectorial F = Pi + 
Qj + Rk se introdujeron en la sección 12.12 mediante las fórmulas 


(12.57) 

y 

(12.58) 


dQ 

dy 


dR 

dz 




Para calcular div F y rot F a partir de esas fórmulas se necesita el conocimiento 
de los componentes de F. Esos componentes, a su vez, dependen de la elección de 
los ejes coordenados en E 3 . Un cambio en la posición de los ejes coordenados sig- 
nificaría un cambio en Ios componentes de F y, como cabe esperar, el correspon- 
diente cambio en las funciones div F y rot F. Con la ayuda del teorema de Stokes 
y del de la divergencia podemos obtener fórmulas para 1a divergencia y el rotacio- 
nal en las que no intervienen los componentes de F. Estas fórmulas demuestran 
que el rotacional y la divergencia representan propiedades intrínsecas del campo 
vectorial F y no dependen de la elección que se haga de los ejes coordenados. 
Vamos a tratar primero la fórmula para la divergencia. 


teorema 12.7. Sea V(t) una esfera de radio t > 0 con centro en el punto 
a de E 3 , y representemos con S(t) la frontera de V(t). Sea F un campo vectorial 
derivable con continuidad en V(t). Entonces si V(t) representa el volumen de 
V(t), y n la normal unitaria exterior a S, tenemos 

(12.59) div F M = JJ ■ F ' n dS ■ 

1 v n S(t) 

Demostración. Sea <p = div F. Si e > 0 tenemos que encontrar un 8 > 0 
tal que 


(12.60) 


<p(a) - 


W(0\ 


ff' 


siempre que 0 < t < ô. 


Puesto que <p es continua en a, para el e dado existe una 3-esfera B(a ; h) tal que 
|ç>(jc) — <p(a)\ < - siempre que x e B(a; h). 
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Por consiguiente, si escribimos q>(à) = q>(x) + [<p(a) — g5(x)] e integramos ambos 
miembros de esta ecuación sobre la esfera V(t) de radio t < h, encontramos 


<p(à) 1^(01 = JJ/ <p( x ) dx dy dz + JJJ [<p(a) 


çj ( x )] dx dy dz. 


Si aplicamos el teorema de la divergencia a la primera integral triple del segundo 
miembro y pasamos este término al primer miembro, obtenemos la relación, 

| <p(a)W(t)\ - JJV- n dS | < JJJ \<p(a) - <p(x)\ dx dy dz < j |V(í)| < c |V(f)|. 

SU) VU) 

Cuando dividimos esta desigualdad por |V(f)| vemos que (12.60) es cierta para 
8 = h. Esto demuestra el teorema. 

En la demostración anterior no hacemos uso especial del hecho de que V(f) 
fuese una esfera. E1 mismo teorema subsiste si, en lugar de esferas, utilizamos 
cualquier conjunto de sólidos V(f) para los que el teorema de la divergencia es 
válido, con tal que esos sólidos contengan el punto a y tiendan hacia a cuando 
f -» 0. Por ejemplo, cada V(f) podría ser un cubo inscrito en una esfera de radio f 
en torno de a; se aplicaría exactamente la misma demostración. 

El teorema 12.7 puede también justificarse con razones físicas. Supongamos 
que F representa el vector densidad de flujo de una corriente estacionaria. La 
integral de superficie F - ndS mide entonces la masa total de fluido que atra- 

SU) 

viesa S en la unidad de tiempo y en la dirección de n. E1 cociente Jj - F • n dSf | V(f)| 

SU) 

representa la masa por unidad de volumen que fluye a través de S en la unidad 
de tiempo en la dirección de n. Cuando t -> 0, el límite de ese cociente es la 
divergencia de F en a. Luego la divergencia en a puede interpretarse como el 
coeficiente de variación de masa por unidad de volumen y por unidad de tiem- 
po en a. 

En algunos libros de Análisis vectorial, la ecuación (12.59) se toma como 
definición de divergencia. Esto permite inmediatamente asignar un significado 
físico a la divergencia. Además, en la fórmula (12.59) no intervienen los compo- 
nentes de F. Por lo tanto, es válida en cualquier sistema de coordenadas. Si ele- 
gimos como V(f) un cúbo con sus aristas paralelas a los ejes xyz y con centro 
en a, podemos utilizar la ecuación (12.59) para deducir la fórmula (12.57) que 
expresa la div F en función de Ios componentes de F. Este procedimiento se 
esboza en el ejercicio 14 de la sección 12.21. 
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Existe una fórmula análoga a la (12.59) que a veces se usa como otra defi- 
nición de rotacional. Dicha fórmula es: 


(12.61) rot F(a) = lim —n x FdS, 

—1^(01 JJ 

donde V(t) y S(t) tienen el mismo significado que en el teorema 12.7. La integral 
de superficie que aparece en el segundo miembro tiene un integrando vectorial. 
Tales integrales pueden definirse eh función de los componentes. La demostra- 
ción de (12.61) es análoga a la del teorema 12.7. 

Existe otra fórmula en la que interviene el rotacional y que puede deducirse 
de (12.61) o bien directamente. Tal forma establece que 

(12.62) « ' rot F(a) = lim -f- <f F • da. 

i -0 |S(t)| Jcifl 

En esta fórmula, S(t) es un disco circular de radio t y centro en a, y S(t) repre- 
senta su área. E1 vector n es la normal unitaria a S(t), y a es la función que des- 
cribe C(t) en una dirección tal que vista desde el extremo de n parece contraria 
a la de las agujas del reloj. E1 campo vectorial F se supone derivable con conti- 
nuidad en S(t). Puede darse una demostración de (12.62) con el mismo método 
usado para demostrar (12.59). Ponemos ç?(x) = n • rot F(x) y razonamos como 
antes, salvo que empleamos integrales de superficie en lugar de integrales triples 
y el teorema de Stokes en lugar del de la divergencia. 

Si F es un campo de velocidad, la integral de línea sobre C(t) se llama circu-. 
lación de F a lo largo de C(t); el límite de (12.62) representa la circulación por 
unidad de área en el punto a. De este modo, n -rot F(a) puede considerarse como 
una «densidad de circulación» de F en el punto a, con respecto a un plano per- 
pendicular a n en a. 

Cuando n toma sucesivamente los valores i, j, y k, los productos interiores 
* • rot F, j -rot F, y k • rot F son los componentes de rot F en coordenadas rec- 
tangulares. Cuando la ecuación (12.61) se toma como punto de partida de la defi- 
nición de rotacional, la fórmula (12.58) de íos componentes rectangulares de 
rot F pueden deducirse de (12.62) exactamente del mismo modo. 

12.21 Ejercicios 

1. Sea S la superficie del cubo unidad 0 < x < 1, 0 < y < 1, 0 < z < 1, y sea n la normal 
unitaria exterior a S. Si F(x, y, z) = x 2 i + y 2 j+z 2 k, empleamos el teorema de la divergen- 
cia para calcular la integral de superficie SS F • n dS. Comprobar el resultado calculando 

la integral de superficie directamente. 

2. Se. corta la esfera x 2 + y 2 + z 2 = 25 por el plano z = 3. La parte menor es un sóli- 
do V limitado por una superficie So constituida por dos partes, una esférica Si y otra 
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plana S 2 . Si la normal unitaria exterior a V escosai + cos fìj + cos yk, calcular el 
valor de la integral de superficie 

J J (xz cos a + yz cos P + cos 7 ) dS 


si a) S es el casquete esférico Si, b) S es la base plana S 2 , c) S es la frontera completa 
Sd. Resolver la parte c) con los resultados de las partes a) y b), y también usando el 
teorema de la divergencia. 

3. Sea n = cos a 1 + cos fij + cos y k la normal unitaria exterior a una superficie cerra- 
da S que limita un sólido homogéneo V del tipo descrito en el teorema de la divergen- 
cia. Supongamos que el centro de gravedad ( x,ŷ,z) y el volumen V| de V son conoci- 
dos. Calcular las siguientes integrales de superficie en función de | Vj y de x,y,z. 

a) JJ (x cos a + y cos P + z cos y) dS. 
s 

b) JJ (xz cos a + 2 yz cos p + 3z 2 cos 7 ) dS. 

c) JJ (y 2 cos a + 2xy cos P - xz cos 7 ) dS. 

d) Expresar Jf (x 2 + y 2 )(xi + yj) ndS en función del volumen ;V| y un momento de 
inercia del sólido. 

En los ejercicios del 4 al 10, df/dn y 3 g/dn indican las derivadas direccionales de los 
campos escalares / y g en la dirección de la normal unitaria exterior n a una superíìcie 
cerrada S que limita un sólido V del tipo descrito en el teorema de la divergencia, Esto 
es, 3//9« = V/ • n y 9g/3 n = Vg n. En cada uno' de los ejercicios demostrar la igualdad 
que se da. Se puede suponer la continuidad de todas las derivadas que intervienen. 

4 - 

5. f I — dS = 0 síempre que / sea armónica en V. 


6. - |"|j/v=î*+ JJJ V/. Vgdxdyd,. 

7 - Jf(/I -S I) JS - JJJ W -S^àddyd,. 

8 - Jf / t‘ K -JJ í I‘ K !i/ ” son 


ambas armónicas en V. 
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si / es armónica en V. 


10. V 2 /(a) = lim - 


s//í 


dS, donde V«) e 


esfera de radio r y centro en a, 


S«) es la superfìcie de V(t), y |V«)i es el volumen de V«). 

11. Sean V una región convexa de E-.ì cuya frontera es una superfìcie cerrada S y n la normal 
unitaria exterior a S. Sean F y G dos campos vectoriales derivables con continuidad 
tales que 


rot F = rot G y div F = div G en todo V, 
y que satisfacen 

G ■ n = F n en toda la superficie S. 

Demostrar que F = G e n todo V. [Indicación. Sea H = F — G , encontrar un campo 
escalar / tal que H = V/, y usar una identidad adecuada para demostrar que 
Jíí \\'Vf '\ 2 dx dy dz = 0. De esto se deduce que H = O en V.] 

V 

12. Dados un campo vectorial G y dos campos escalares / y g, ambos derivables con con- 
tinuidad en un sólido convexo V limitado por una superficie cerrada S. La normal uni- 
taria exterior a S la representamos con n. Demostrar que existe por lo menos un campo 
vectorial F que satisface las tres condiciones siguientes: 

rot F = G y div F = g enV, F ■ n = f sobre S. 

13. Sea S una superficie paramétrica regular con la propiedad de que cada recta que pasa por 
P corta a S una vez a lo sumo. Representemos con íî(S) el conjunto de rectas que 
pasando por P atraviesan S. (Véase figura 12.19.) E1 conjunto Í2(S) se llama ângulo sólido 
de vértice en P subtendido por S. Sea 2(a) la intersección de S2(S) en la superftcie de la 
esfera de radio a y centro en P. E1 cociente 

area de 2(a) 


que se representa por Í2(S) y se utiliza como medida del ángulo sólido Ï2(S). 
a) Demostrar que este cociente es igual a la integral de superficie 

donde r es el radio vector que une P a un punto cualquiera de S, y r =||r|| .E1 vector n 
es la normal unitaria a S en la dirección de alejamiento de P. Esto muestra que el 
cociente Í2(S)| es independiente del radio a. Por consiguiente, el ángulo sólido puede ser 
medido por el área de la intersección de í2(S)y la esfera unidad en torno a P. [ Indica - 
ción. Aplicar el teorema de la divergencia a la porción de Í2(S) qomprendida entre 
S y Z(a).] 
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Figura 12.19 Ángulo sólido Í2(S) con vértice en P subtendido por una superficie S. 
Su medida viene dada por el cociente |fí(S)| = — * ^ . 


b) Dos planos se cortan a lo largo de un diámetro de una esfera con Centro en P. 
E1 ángulo de intersección es e, siendo 0 < 9 < 17. Sea S la parte menor de la superficie 
de la esfera interceptada por los dos planos. Demostrar que |íî(S)| = 2«. 

14. Sean V(t) un cubo de arista 2t y centro en «, y S(t) la frontera del citado cubo. Como 
de costumbre n es la normal unitaria exterior a S(t) y sea jV(í)| el volumen del cubo. 
Para un campo vectorial dado F diferenciable con continuidad en «, suponer que existe 
el siguiente límite: 


s«> 

y emplearlo como definición de div F(a). Elegidos unos ejes coordenados xyz paralelos 
a las aristas de V(t), sean P, Q y R Ios componentes de F relativos a ese sistema de 
coordenadas. Demostrar que div F(a) = ZV>(«) + D 2 Q(a) + D 3 R(a). [ Indicación. Ex- 
presar la integral de superficie como suma de seis integrales dobles tomadas sobre las 
caras del cubo. Demostrar entonces que l/|V(t)j multiplicado por la suma de las dos 
integrales dobles sobre las caras perpendiculares al eje z tiende al límite D 3 R(a) cuando 
t—>0. Razonar de modo parecido para los restantes términos.] 
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15. Un campo escalar <p tiene la propiedad 

IIVç>|| 2 = 4<f y div (ç>Vç>) = 10?>. 
Calcular la integral de superfìcie 

//£-• 

s 


donde S es la superficie de la esfera unidad con centro en el origen, y 9<p/3n es la deri- 
vada direccional de <p en la dirección de la normal unitaria exterior a S. 
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FUNCIONES DE CONJUNTO 
Y PROBABILIDAD ELEMENTAL 


13.1 Introducción histórica 

Una disputa entre jugadores en 1654 llevó a dos famosos matemáticos fran- 
ceses, Blaise Pascal y Pierre de Fermat, a la creación del Cálculo de probabilida- 
des. Antoine Gombaud, caballero de Méré, noble francés interesado en cuestiones 
de juegos y apuestas, llamó ia atención a Pascal respecto a una aparente contra- 
dicción en un popular juego de dados. El juego consistía en lanzar 24 veces un 
par de dados; y el problema en decidir si era lo mismo apostar la misma cantidad 
a favor o en contra de la aparición por lo menos de un «doble seis» en las 24 
tiradas. Una regla del juego aparentemente bien establecida condujo a de Méré a 
creer que apostar por un doble seis en 24 tiradas era ventajoso, pero sus propios 
cálculos indicaban justamente lo contrario. 

Éste y otros problemas planteados por de Méré motivaron un intercambio de 
cartas entre Pascal y Fermat en las que por primera vez se formularon los princi- 
pios fundamentales del Cálculo de probabilidades. Si bien unos pocos problemas 
sobre juegos de azar habían sido resueltos por matemáticos italianos en los si- 
glos xv y xvi, no existía una teoría general antes de esa famosa correspondencia. 

E1 científico holandés Christian Huygens, maestro de Leibniz, enterado de 
esa correspondencia publicó rápidamente (en 1657) el primer libro de probabili- 
dades; titulado De Ratiociniis in Ludo Aleae, fue un tratado de problemas rela- 
cionados con los juegos. E1 Cálculo de probabilidades llegó a ser pronto popular 
por sus alusiones a los juegos de azar, y se desarrolló rápidamente a lo largo del 
siglo xviii. Quienes más contribuyeron a su desarrollo en ese período fueron Jakob 
Bernoulli (*) (1654-1705) y Abraham de Moivre (1667-1754). 

En 1812, Pierre de Laplace (1749-1827) introdujo gran cantidad de ideas 
nuevas y técnicas matemáticas en su libro, Théorie analytique des probabilités. An- 

(*) Citado algunas veces como James Bernoulli. 
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tes de Laplace, el Cálculo de probabilidades prácticamente consistía en un aná- 
lisis matemático de los juegos de azar. Laplace demostró que esa teoría podía 
ser aplicada a multitud de problemas científicos y prácticos. Ejemplos de tales 
aplicaciones son la teoría de errores, la matemática actuarial y la mecánica estadís- 
tica que se desarrollaron en el siglo xix. 

A1 igual que ha ocurrido con otras muchas ramas de la Matemática, el de- 
sarrollo del Cálculo de probabilidades ha sido estimulado por la variedad de sus 
aplicaciones. Inversamente, cada avance en la teoría ha ampliado el campo de su 
influencia. La Estadística Matemática es una rama importante del Cálculo de 
probabilidades aplicado; otras aplicaciones las tenemos en campos tan distintos 
como la Genética, la Psicología, la Economía y la Ingeniería. Muchos autores han 
contribuido al desarrollo de la teoría desde el tiempo de Laplace; entre los más 
importantes están Chebyshev, Markov, von Mises y Kolmogorov. 

Una de las dificultades que se presentaron al desarrollar una teoría matemá- 
tica de la teoría de la probabilidad ha sido alcanzar una definición de probabili- 
dad lo bastante precisa para su utilización matemática, pero lo bastante amplia 
para que sea aplicable a un número de fenómenos lo mayor posible. La búsqueda 
de una definición completamente aceptable duró cerca de tres siglos y fue carac- 
terizada por gran número de controversias. E1 asunto fue definitivamente resuelto 
en el siglo xx al tratar la teoría de la probabilidad en forma axiomática. En 1933 
una monografía del matemático ruso A. Kolmogorov estableció una introducción 
axiomática que constituyó la base para la moderna teoría. (La traducción inglesa 
de la monografía de Kolmogorov se titula Foundations of Probability Theory, 
Chelsea, New York, 1950.) Desde entonces las ideas se han ido afmando algo 
más y hoy día la teoría de la probabilidad es parte de una disciplina más general 
que es la teoría de la medida. 

Este capítulo presenta las nociones fundamentales de la moderna teoría de la 
probabilidad elemental junto con sus conexiones con la teoría de la medida. Tam- 
bién se dan algunas aplicaciones, especialmente a los juegos de azar tales como 
lanzamiento de monedas, dados y juegos de naipes. Esta exposición pretende 
poner de manifiesto la estructura lógica del tema como ciencia deductiva y suscitar 
en el lector el interés en el modo de pensar probabilístico. 

13.2 Funciones de conjunto con aditividad finita 

E1 área de una región, la longitud de una curva, o la masa de un sistema de 
partículas son números que miden la magnitud o contenido de un conjunto. Todas 
esas medidas tienen ciertas propiedades comunes. Establecidas en forma abstracta, 
conducen a un concepto general llamado función de conjunto con aditividad finita. 
Más adelante introduciremos la probabilidad como otro ejemplo de una función 
de este tipo. Para preparar el camino, discutimos primero algunas propiedades 
comunes a todas esas funciones. 
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Una función /:.r/ -» R cuyo dominio es una colección s/ de conjuntos y cu- 
yos valores son números reales, se llama función de conjunto. Si A es un conjunto 
de la colección s/, el valor de la función en A se representa por f(A). 

DEFINICIÓN DE FUNCIÓN DE CONJUNTO CON ADITIVIDAD FINITA. Una funCÌÓn 
de conjunto f: s-J -» R se dice que es de aditividad finita si 

(13.1) fU U B) =f(A) +f(B) 

siempre que A y B sean conjuntos disjuntos en s/ tales que A u B pertenezca 
tambìén a s/. 

E1 área, la longitud y la masa son ejemplos de funciones de conjuntos con 
aditividad finita. En esta sección se discuten consecuencias de la ecuación (13.1). 

En las aplicaciones corrientes, los conjuntos de s/ son subconjuntos de un 
conjunto dado S, llamado conjunto universal. Es frecuente tener que efectuar las 
operaciones de reunión, intersección y complementación sobre los conjuntos de 
s/. Para asegurarse de que s/ es cerrado respectc a esas operaciones imponemos 
a s/ que sea un álgebra booleana, que se define como sigue. 

DEFINICIÓN DE UN ÁLGEBRA BOOLEANA DE CONJUNTOS. Unû clase no VClCÍa s/ 
de subconjuntos de un conjunto universal S se llama álgebra booleana si para todo 
par A y B de conjuntos de sl tenemos 

A'JBesZ y A!es/. 

Aquí A' = S — A, es el complemento de A respecto a S. 

Un álgebra booleana s/ también es cerrada para las intersecciones y dife- 
rencias, ya que tenemos 

A nB= (A’ U B'Y y A - B = A nB'. 

Esto implica que el conjunto vacío 0 pertenece a s/ ya que 0 = A - A para 
algún A de s/ . También el conjunto universal S pertenece a s/ puesto que 
S = 0'. 

A partir de los subconjuntos de un conjunto universal dado S pueden cons- 
truirse gran número de álgebras booleanas. La menor de esas álgebras es la clase 
o/ = { 0, S}, que consta tan sólo de dos subconjuntos especiales: 0 y S. En el 
otro extremo está la clase s/ x , que consta de todos los subconjuntos de S. Toda 
álgebra booleana s/ constituida con subconjuntos de S satisface las relaciones de 
inclusión s / 0 £ s/ £ s/ x . 
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La propiedad de la aditividad finita de funciones de conjunto de la ecuación 

(13.1) exige que A y B sean conjuntos disjuntos. De esta exigencia se desprende 
el teorema siguiente. 

teorema 13.1. Si f:,rf -> R es una función de conjunto con aditividad 
finita definida sobre un álgebra de Boole srf de conjuntos, entonces para todo 
par de conjuntos A y B de tenemos 

(13.2) f(A U B) =f(A) +f(B - A), 

y 

(13.3) f(A U B) = f(A) + f(B) - f(A n B). 

Demostración. Los conjuntos A y B — A son disjuntos y su reunión es 
A U B. Luego, aplicando (13.1) a + y a B — A obtenemos (13.2). 

Para demostrar (13.3) observemos primero que A n B' y B son conjuntos 
disjuntos cuya reunión es A u B. Por tanto según (13.1) tenemos 

(13.4) f(A U B) =f(A n B') +f(B). 

Asimismo, A n B' y A n B son conjuntos disjuntos cuya reunión es A, con lo que 
(13.1) nos da 

(13.5) f(A) =f(A n B') +f(A n B). 

Restando (13.5) de (13.4) obtenemos (13.3). 

13.3 Medidas con aditividad finita 

Las funciones de conjunto que representan áreas, longitudes y masas poseen 
propiedades comunes. Por ejemplo, son todas funciones de conjunto no negativas. 
Esto es, 


f(A) > 0 

para cada conjunto A de la clase s/ que se considera. 

DEFINICIÓN DE MEDIDA CON ADITIVIDAD FINITA. Una funCÌÓn de COnjuntO 
no negativa f: ,9? - * R que es con aditividad finita se dice que es una medida con 
aditividad finita, o simplemente una medida. 

Aplicando el teorema 13.1 obtenemos inmediatamente las siguientes propie- 
dades de las medidas. 
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teorema 13.2. Sea f: sJ -*■ R una medida con aditividad finita definida 
sobre un álgebra booleana stf. Para todos los conjuntos A y B de sJ tenemos 

a) f(A U B) < f(A) + f(B). 

b) f(B - A) = f(B) — f(A) si A^B. 

c) f(A) < f(B) si A c B. (Propiedad de monotonía) 

d) /(0) = O. 

Demostración. La parte a) se deduce de (13.3), y la parte b) de (13.2). 
La parte c) resulta de b), y d) se obtiene haciendo A =fi = 0 en b). 

eiemplo. Número de elementos de un conjunto finito. Sea S = {a u +,..., 
a„ } un conjunto que consta de n elementos distintos, y sea sJ la clase de todos 
los subconjuntos de S. Para cada + de jJ, representemos por v(A) el número de 
elementos distintos de A (v es la letra griega «ni»). Es fácil verifìcar que esta 
función es de aditividad fìnita en sJ. En efecto, si + tiene k elementos y B m ele- 
mentos, v(/4) = k y v(B) = m. Si A y B son disjuntos es evidente que + U B es 
un subconjunto de S con k + m elementos, así que 

v(A U B) = k + m = v(A) + v(B). 


Esta función de conjunto es no negativa, con lo que v es una medida. 

13.4 Ejercicios 

1. Representemos por sj Ia clase de todos los subconjuntos de un conjunto universal dado 
y sean A y B conjuntos cualesquiera de sj . Demostrar que: 

a) A n B' y B son disjuntos. 

b) A u B = (A n B') U B. (Esta fórmula expresa A VJ B como reunión de dos con- 
juntos disjuntos.) 

c) A n B yA n 5'son disjuntos. 

d) (A n B) U (A n B') = A. (Esta fórmula expresa A como reunión de dos conjuntos 
disjuntos.) 

2. E1 ejercicio 1 b) nos muestra la posibilidad de expresar la reunión de dos conjuntos 
como reunión de dos conjuntos disjuntos. Expresar de manera parecida la reunión de 
tres conjuntos A x u A 2 u A 3 y, más general, de n conjuntos A^ U A 2 U • 4 • U A n . 
Ilustrar con un diagrama el caso n = 3. 

3. A1 estudiar el conjunto S que consta de 1000 graduados universitarios diez anos después de 
su graduación, se observó que los «triunfantes» formaban un subconjunto A de 400 miem- 
bros, los graduados por Caltech otro B de 300, y la intersección A n f?constaba de 200. 
a) Empleando la notación de la teoría de conjuntos y los conceptos de reunión e inter- 
sección de A, B y sus complementarios A’ y B' respecto de S, expresar los subconjuntos 
de aquellas personas de S que poseen las características siguientes: 

i) Ni «triunfantes» ni graduados por Caltech. 

II) «Triunfantes» pero no graduados por Caltech. 
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iii) «Triunfantes» o graduados por Caltech o ambas cosas. 

iv) «Triunfantes» o graduados por Caltech pero no ambas cosas. 

v) Pertenecen tan sólo a uno de los subconjuntos A o B. 

b) Determinar el número exacto de individuos de cada uno de los cinco subconjuntos 
anteriores. 

4. Sea / una función de conjunto de aditividad finita defmida en una clase de conjuntos SÍ. 
Sean A\,... ,A„ n conjuntos de s/ tales que A, fl A, = 0 si i ^ /. (Una tal colección 

se denomina colección disjunta de conjuntos.) Si la reunión (J A k pertenece a sí para 

todo m < n, utilizar el método de inducción para demostrar que 

/(û.) = Ì/(^). 

En los ejercicios 5, 6 y 7, S representa un conjunto finito que consta de n elementos 
distintos, sea S = {ai,an,... ,a„}. 

5. Sea Ai = {ai}, el subconjunto que consta del único elemento a\. Demostrar que la 
clase = {0,Ai,A[,S} es la más pequena álgebra de Boole que contiene A\. 

6. Sean Ai = {ai}, A2 = { a 2}. En forma parecida a la utilizada en el ejercicio 5, descri- 

bir la más pequena álgebra de Boole SS 2 que contenga A\ y A2. 

7. Hacer lo mismo que en el ejercicio 6 para los subconjuntos Ai = {ai}, A2 = {02} y 

Á 3 = {«3}- 

8. Si 38 k representa la mínima álgebra de Boole que contiene los k subconjuntos Ai = {ai}, 
M = {02},... ,At = {ó*}, demostrar que contiene 2 k+1 subconjuntos de S si 
k < n y 2‘ subconjuntos si k = n. 

9. Sea / una función de conjunto con aditividad finita definida sobre el álgebra booleana 
de todos los subconjuntos de un conjunto universal dado S. Supongamos que 


f(A n B) = f(A)f(B) 

para dos subconjuntos particulares A y B de S. Si f(S) = 2, demostrar que 
f(A uB) =f(A') +f(B') — f(A')f(B'). 


10. Si A y B son dos conjuntos, su diferencia simétrica A A B es el conjunto defmido por 
A A B=(A — B) u (B — /f). Demostrar cada una de las siguientes propiedades de la 
diferencia simétrica. 

a) A A B = B A A. 

b) A A A = 0 . 

c) A A B <= (A A C) V (C A B). 

d) A A B es disjunto con la intersección de A y B. 

e) (A A B) AC = A A(B AC). 

f) S/ / es una función de conjunto con aditividad finita defmida sobre el álgebra de 
Boole .p/ de todos los subconjuntos de un conjunto dado S, entonces para todo par 
A y B de s/ tenemos f(A A B)= f(A) + f(B) - 2 f(A n B). 
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13.5 Definición de probabilidad para espacios muestrales finitos 

En el lenguaje de las funciones de conjunto, la probabilidad es un tipo espe- 
cial de medida (representada aquí por P) definida sobre una particular álgebra 
booleana 88 de conjuntos. Los elementos de 88 son subconjuntos de un conjun- 
to universal S. En la teoría de la probabilidad el conjunto universal S se llama 
espacio muestral. Primero comentaremos la defmición de probabilidad para es- 
pacios muestrales frnitos y luego lo haremos para los infmitos. 

DEFINICIÓN DE PROBABILIDAD PARA ESPACIOS MUESTRALES FINITOS. Sea 88 
un álgebra de Boole cuyos elementos son subconjuntos de un conjunto finito dado 
S. Una función de conjunto P definida en 88 se llama medida de probabilidad 
si satisface las tres condiciones siguientes: 

a) P es de aditividad finita. 

b) P es no negativa. 

c) P(S) = 1. 

Dicho de otro modo, para los espacios muestrales finitos la probabilidad es 
simplemente una medida que asigna el valor 1 al espacio completo. 

Importa darse cuenta de que para una descripción completa de la medida de 
probabilidad deben precisarse tres ideas: el espacio muestral S, el álgebra de 
Boole 88 constituida con ciertos subconjuntos de S, y la función de conjunto P. 
La terna (S, 8$, P) se denomina frecuentemente espacio de probabilidad. En la ma- 
yoría de las aplicaciones elementales el álgebra de Boole -88 es la colección de 
todos los subconjuntos de S. 

ejemplo. E1 juego de «cara o cruz» es una aplicación de la teoría de pro- 
babilidad. Como espacio muestral S tomamos el conjunto de todos los resultados 
posibles en el juego. Cada resultado es o «cara» o «cruz» que representamos con 
los símbolos h y t. Dicho espacio muestral es pues {h, t} es decir, el conjunto que 
consta de h y t. Como álgebra booleana consideramos la colección de todos los 
subconjuntos de S; éstos son cuatro, 0, S, H y T, donde H = {h} y T = {t}. 
Asignemos ahora probabilidades a cada uno de esos subconjuntos. Para 0 y S 
•no tenemos opción a elegir valores de probabilidad. Por la propiedad b), P(S) = 1, 
y como P es no negativa, P(0) = 0. En cambio, tenemos libertad en la asignación 
de la probabilidad a los otros dos subconjuntos, H y T. Ya que H y T son con- 
juntos disjuntos cuya reunión es S, la propiedad aditiva exige que 

P(H) + P(T) = P(S) = 1. 

Como valores de P(H) y P(T) podemos tomar valores cualesquiera no negativos 
pon tal de que su suma sea 1. Si tenemos en cuenta que la moneda es imparcial 
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de modo que no existe razón a priori para preferir cara o cruz, parece natural 
asignar Ios valores 


= p(T) = j. 

Si, en cambio, la moneda no es geométricamente perfecta, podremos asignar valores 
diferentes a esas dos probabilidades. Por ejemplo, los valores P{H) = !, y P(T) = § 
son tan aceptables como P(H) = P(T) = $. En efecto, para todo número real p 
en el intervalo 0 < p < 1 podemos definir P(H) = p y P(T) = 1 — p, y la función 
resultante P satisfará todas las condiciones que se exigen a una medida de proba- 
bilidad. 

Para una moneda determinada, no existe un método matemático para precisar 
cuál es la probabilidad p «real». Si escogemos p = \ podemos deducir consecuen- 
cias lógicas en la hipótesis de que la moneda es correcta y no presenta sesgo. 
La teoría desarrollada para el estudio de las probabilidades en monedas correctas, 
puede utilizarse como test comprobatorio de su carencia de sesgo, efectuando un 
gran número de experiencias con ella y comparando los resultados experimentales 
con las predicciones teóricas. E1 poner de acuerdo la teoría y la evidencia empí- 
rica pertenece a la rama de aplicación de la teoría de la probabilidad que se llama 
inferencia estadística, y que no expondremos en este libro. 

E1 ejemplo anterior es una típica aplicación del Cálculo de probabilidades. 
Las cuestiones probabilísticas se presentan a menudo en situaciones llamadas 
«experimentos». No intentaremos definir un experimento; en cambio, mencionare- 
mos tan sólo algunos ejemplos corrientes: lanzar una o varias monedas, echar un 
par de dados, repartir una mano de bridge, sacar una bola de una urna, recuento 
de las muchachas estudiantes en el Instituto Tecnológico de California, selección 
de un número en una guía telefónica, registro de la radiación en un contador 
Geiger. 

Para discutir las cuestiones de probabilidad que surgen en tales experimentos, 
nuestro primer trabajo es la construcción de un espacio muestra S que pueda utili- 
zarse para representar todos los resultados posìbles del experimento, como hicimos 
en el juego de cara y cruz. Cada elemento de S representará un resultado del expe- 
rimento y cada resultado corresponderá a uno y sólo un elemento de S. A continua- 
ción, elegimos un álgebra de Boole 38 de subconjuntos de S (casi siempre todos los 
subconjuntos de S) y entonces se define una medida de probabilidad P sobre 
La elección de S,3S, y P dependerá de la información que se posea acerca de los 
detalles del experimento y del problema que nos vamos a plantear. E1 objeto del 
Cálculo de probabilidades no es discutir si el espacio de probabilidad (S, P) ha 
sido elegido correctamente. Esto pertenece a la ciencia o juego del que el experi- 
mento ha surgido, y tan sólo la experiencia puede darnos idea de si la elección fue 
bien hecha o no lo fue. El Cálculo de probabilidades es el estudio de las conse- 
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cuencias lógicas que pueden deducirse una vez está dado el espacio de probabili- 
dad. La elección de un buen espacio de probabilidad no es teoría de probabilidad 
— ni siquiera es matemática; es, en cambio, parte del arte de aplicar la teoría 
probabilística al mundo real. 

Si S = {a 1( a 2 ,... ,a„}, y si consta de todos los subconjuntos de S, la 
función de probabilidad P está completamente determinada si conocemos sus va- 
lores para los conjuntos de un solo elemento, 

P({ ai }),P({a 2 }),...,P({a n }). 


En efecto, todo subconjunto A de S es una reunión disjunta de los conjuntos ante- 
riores, y P(A) está determinada por la propiedad aditiva. Por ejemplo, cuando 

A = {aj U {a 2 } U • • • U {a s }, 
la propiedad aditiva exige que 

P(A) = ÌP({aJ). 

Para simplifìcar la notación y la terminología, escribimos P(ad en lugar de P({ ai }). 
Este número también se llama probabilidad del punto a,-. Por lo tanto, la asignación 
de la probabilidad puntual P(x) a cada elemento x de un conjunto finito S equivale 
a una descripción completa de la función de probabilidad P. 

13.6 Terminología propia del cálculo de probabilidades 

Cuando se habla de probabilidades, a menudo se oyen frases tales como «dos 
sucesos son igualmente probables», «un suceso es imposible», o «un suceso es 
cierto». Las expresiones de este tipo tienen sentido intuitivo y es agradable y útil 
saber emplear un lenguaje tan lleno de colorido en las discusiones matemáticas. 
Antes de hacerlo así, no obstante, es necesario exponer el signifìcado de este len- 
guaje usando los conceptos fundamentales de nuestra teoría. 

Debido a que el método probabilístico se usa en cuestiones prácticas, es conve- 
niente imaginarse que cada espacio de probabilidad (S, 39, P) está asociado a un 
experimento real o ideal. E1 conjunto universal S puede entonces concebirse como 
la colección de todos los resultados imaginables del experimento, como en el ejem- 
plo de la moneda comentado en la sección precedente. Cada elemento de S se llama 
resultado o muestra y los subconjuntos de S que se presentan en el álgebra de 
Boole 39 se denominan sucesos. Los motivos de esta terminología se pondrán en 
evidencia al tratar àlgunos ejemplos. 

Supongamos un espacio de probabilidad ( S, 38, P) asociado a un experimento. 
Sea A un suceso, y supongamos que el experimento se lleva a cabo y que su resul- 
tado es x. (En otras palabras, sea x un punto de S.) Este resultado puede o no 
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pertenecer al conjunto A. Si pertenece, se dice que el suceso A ha ocurrido. En el 
caso contrario, el suceso A no ha ocurrido, en cuyo caso xeA', lo que equivale 
a decir que ha ocurrido el suceso complementario A’. Un suceso A es imposible si 
A — 0, porque en este caso ningún resultado del experimento puede pertenecer 
a A. E1 suceso A es cierto si A = S, porque entonces todo resultado de la prueba 
pertenece a A. 

La función de probabilidad P asigna a cada suceso A una probabilidad P(A). 
[Del valor de P(A) y del modo de asignarlo no nos ocuparemos por el momento.] 
E1 número P(A) se llama la probabilidad de que un resultado de la prueba sea un 
elemento de A. También decimos que P(A) es la probabilidad de que el suceso A 
ocurra al efectuar el experimento. 

A1 suceso imposible 0 debe asignarse probabilidad cero porque P es una me- 
dida de aditividad finita. No obstante, existen sucesos con probabilidad cero y que 
no son imposibles. En otras palabras, algunos de los subconjuntos no vacíos de S 
pueden tener asignada probabilidad cero. A1 suceso cierto S se asigna probabili- 
dad 1 según la correcta definicjón de probabilidad, pero pueden existir otros sub- 
conjuntos que también tienen asignada probabilidad 1. En el ejemplo 1 de la 
sección 13.8 se citan conjuntos no vacíos con probabilidad cero y subconjuntos 
propios de S que tienen probabilidad 1. 

Dos sucesos A y B son igualmente probables si P(A) = P(B). E1 suceso A es 
más probable que el B si P(A) > P(B), y por lo menos tan probable como el B si 
P(A) > P(B). La tabla 13.1 nos muestra una lista de locuciones del lenguaje ha- 
bitual en las discusiones de la teoría de probabilidades. Las letras A y B represen- 
tan sucesos, y x el resultado de un experimento asociado al espacio muestral S. 
Cada fila de la columna de la izquierda es una afirmación relativa a los sucesos 
A y B, y en la misma fila en la columna de la derecha se expresa la misma afìr- 
mación en el lenguaje de la teoría'de conjuntos. 


Tabla 13.1 Proposiciones usadas en la Teoría de Probabilidades 
y su significado en la de conjuntos 


Proposiciones Significado en la teoría de conjuntos 

Por lo menos uno de los sucesos A o B ocurre 

xeA^JB 

Ambos sucesos A y B ocurren 

xe A n B 

Ni A ni B ocurren 

xeÁ r> B' 

A ocurre y B no 

xeA n B’ 

Exactamente ocurre uno de los sucesos A o B 

x e(A r, B') 'J (A’ n B) 

No más de uno de los sucesos A o B ocurre 

xe(A r\ B)’ 

Si A ocurre, también B (A implica B ) 

A e B 

A y B se excluyen mutuamente 

A n B = 0 

Suceso A o suceso B 

A u B 

Suceso A y suceso B 

A r\B 
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13.7 Ejercicios 

Sean S un espacio muestral dado y A, B, C sucesos cualesquiera (esto es, subconjuntos 
de S en la correspondiente álgebra de Boole 3B). Cada una de las afirmaciones de los ejer- 
cicios del 1 al 12 se expresa con una proposición. Expresar dichas afirmaciones como reunio- 
nes e intersecciones de A, B y C y de sus complementos. 

1. Si ocurre A, no ocurre B. 7. Por lo menos dos de los A, B, C ocurren. 

2. Ninguno de los sucesos A, B, C ocurre. 8. Ocurren exactamente dos. 

3. Tan sólo ocurre A. 9. Ocurren no más de dos. 

4. Por lo menos uno de los A, B, C ocurre.10. Ocurren A y C, pero no B. 

5. Uno exactamente de los A, B, C ocurre.ll. Ocurren los tres sucesos. 

6. No ocurre más que uno. 12. Ocurren no más de tres. 

13. A designa el suceso de conseguir un total impar al lanzar dos dados, y B el suceso de 
sacar por lo menos un 6. Expresar por una frase cada uno de los sucesos siguientes: 

a) A u fl, d) A' n B, 

b ) AnB, e) Á r\ B’, 

c) A r\ B', 0 A' u B. 

14. Sean A y B dos sucesos. Demostrar que 

P(A n B) <, P(A) < P(A uí)< P(A) + P(B). 

15. A y B representan dos sucesos y sean a = P(A), b = P(B), c = P(A n fl).Calcular en 

función de a, b, y c, las probabilidades de los sucesos siguientes: 

a) A', d) A' u fl', 

b) fl , e) A' u B, 

c) A ufl, 0 A nfl'. 

16. Dados tres sucesos A, B, C. Demostrar que 

P(A u fluC) = P(A) + fl(fl) + P(C) - P(A n fl) - P(A n C) - P(B n C) + P(A n fl n C) 


13.8 Ejemplos resueltos 

A continuación veremos cómo pueden usarse los conceptos de las secciones 
precedentes, para resolver problemas típicos de probabilidades. 

ejemplo 1 . tCuál es la probabilidad de que por lo menos una cara salga en 
dos tiradas de una moneda? 
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Primera solución. E1 experimento consiste en lanzar una moneda dos veces; 
el conjunto S de todos Ios resultados posibles puede expresarse como sigue: 

S = {hh, ht, th, tt}. 

Si aceptamos que esos resultados son igualmente probables, asignamos la probabi- 
lidad puntual P(x) = \ a cada x de S. E1 suceso «que se presente por lo menos 
una cara» puede representarse por el subconjunto 

A = {hh,ht,th}. 

La probabilidad de este suceso es la suma de las probabilidades puntuales de sus 
elementos. Luego, P(A) = ì + i + i = |. 

Segunda solución. Supongamos que se usa el mismo espacio muestral pero 
que asignamos las probabilidades puntuales como sigue: (*) 


P(hh) = 1, P(ht) = P(th) = P(tt) = 0. 

Entonces la probabilidad del suceso «por lo menos sale una cara» es 

P(hh) + P(ht) + P(th) = 1 + 0 + 0 = 1. 

E1 hecho de que lleguemos a un resultado final distinto del conseguido en la pri- 
mera solución no debe alarmar al lector. Partimos de un conjunto de premisas 
distinto. Consideraciones de tipo psicológico pueden llevarnos a pensar que la 
asignación de probabilidades en la primera solución es la más natural. No obstante, 
muchos podrían estar de acuerdo en que esto es así si la moneda es «imparcial»! 
Sin embargo, si la moneda está «cargada» de manera que siempre salga cara, la 
asignación hecha en la segunda solución es más natural. 

E1 ejemplo anterior nos demuestra que no cabe esperar respuesta única a la 
pregunta formulada en el mismo. Para contestar en forma adecuada tenemos que 
especificar la elección del espacio muestral y la asignación de las probabilidades 
puntuales. La probabilidad de un suceso puede deducirse de manera lógica única- 
mente cuando se conocen el espacio muestral y la asignación de las probabilidades 
puntuales. Eligiendo de distintos modos el espacio muestral y las probabilidades 
puntuales puede llegarse a contestaciones «correctas» diferentes de la misma 
cuestión. 

A veces, la asignación de probabilidades a los resultados particulares de un 

(*) Nótese que para esta asignación de probabilidades hay subconjuntos de S no vacíos 
con probabilidad cero y subconjuntos propios con probabilidad 1. 
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experimento viene dictada por el lenguaje utilizado al describirlo. Por ejemplo, 
cuando un objeto es elegido «al azar» en un conjunto íìnito de n elementos, se 
entiende que cada resultado es igualmente probable y podría asignársele probabili- 
dad 1/n. Análogamente, cuando lanzamos una moneda o un dado, si no tenemos 
a priori motivo alguno para pensar que la moneda o el dado no son perfectos, 
suponemos que todos los resultados son igualmente probables. Este convenio se 
adoptará en todos los ejercicios de este capítulo. 

ejemplo 2. Si un naipe es sacado al azar de cada una de dos barajas, <Lcuál 
es la probabilidad de que por lo menos uno sea el as de corazones? 

Solución. E1 experimento consiste en tomar dos naipes, a y b, uno de cada 
baraja. Representaremos un resultado por un par ordenado (a, b). E1 número de 
resultados posibles, esto es, el número total de pares distintos (a, b) del espacio 
muestral S es 52 2 . Asignamos a cada uno de esos pares la probabilidad 1/52 2 . 
E1 suceso en el que estamos interesados es el conjunto A de pares (a, b), en los 
que o a o b es el as de corazones. En A hay 52 + 51 elementos. Por tanto, en 
estas hipótesis deducimos que 


J_1_ 

26 52*‘ 


ejemplo 3. Si dos naipes se sacan al azar de una baraja; icuál es la proba- 
bilidad de que una de ellas sea un as de corazones? 


Solución. Como en el ejemplo 2 empleamos pares ordenados (a, b) como 
elementos del espacio muestral. En este caso el citado espacio tiene 52-51 elemen- 
tos y el suceso A que se considera tiene 51 + 51 elementos. Si asignamos la pro- 
babilidad puntual 1/(52-51) a cada resultado obtenemos 


P(A) = - 


26 ‘ 


ejemplo 4. iC uál es la probabilidad de sacar 6 o menos de 6 con tres 
dados. 


Solución. Designamos cada resultado del experimento como una terna 
( a , b, c) donde a, b y c pueden tomar valores de 1 a 6. Por lo tanto, el espacio 
muestral consta de 6 3 elementos y asignamos la probabilidad 1/6 3 a cada resultado. 
E1 suceso A en cuestión es el conjunto de todas las ternas que satisfacen la des- 
igualdad 3 < a + b + c < 6. Si A„ representa los conjuntos (a, b, c) para los 
cuales a + b + c = n, tenemos 

A =+ 3 V Ai V A & UA e . 
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La enumeración directa muestra que los conjuntos A n , con n — 3, 4, 5 y 6 con- 
tienen 1, 3, 6 y 10 elementos respectivamente. Por ejemplo, el conjunto A* viene 
dado por 

A 6 = {(1,2, 3), (1,3,2), (I, 1,4), (1,4, 1), (2, 1,3), 


(2, 3,1), (2, 2, 2), (3, 1,2), (3, 2, 1), (4, 1,1)}. 


Por tanto, A tiene 20 elementos y 


P(A) = 


20 

6 2 3 


_5 

54' 


ejemplo 5. Se lanza un dado una vez. iCuál es la probabilidad de que el 
número de puntos conseguido sea par o múltiplo de 3? 


Solución. Elegimos el espacio muestral S = {1, 2, 3, 4, 5, 6}, que consta 
de seis elementos, a cada uno de los cuales asignamos la probabilidad y 6 . E1 suceso 
«par» es el conjunto A = {2, 4, 6}, el suceso «múltiplo de 3» es B = {3, 6}. Nos 
interesa su reunión, que es el conjunto A u B = {2, 3, 4, 6}. Puesto que este 
conjunto posee cuatro elementos tenemos P(A u B) = %. 

Este ejemplo puede resolverse de otro modo, usando la fórmula 


P(A U B) = P(A) + P(B) - P(A n B) = | + | - 


13.9 Ejercicios 

1. Sea S un espacio muestral finito de n elementos. Supongamos que asignamos la misma 
probabilidad a cada uno de los puntos de S. Sea A un subconjunto de S que conste 
de k «lementos. Demostrar que P(A) = k/n. 

En cada uno de los ejercicios 2 al 8, describir la elección del espacio muestral y la asig- 
nación de probabilidades. En los ejercicios relacionados con juegos de naipes, se supone 
que todos los naipes tienen la misma probabilidad de ser repartidos. 

2. Se mezclan cinco monedas falsas con nueve auténticas. 

a) Se selecciona al azar una moneda. Calcular la probabilidad de que sea falsa. 
Si se seleccionan dos monedas, calcular la probabilidad de que: 

b) una sea buena y una falsa. 

c) las dos sean falsas. 

d) las dos sean buenas. 

3. Calcular la probabilidad de cada uno de los sucesos que se describieron en el ejercicio 13 
de la sección 13.7. Asignar la misma probabilidad a cada uno de los 36 elementos del 
espacio muestral. 
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4. tCuál es la probabilidad de sacar por lo menos uno de los resultados 7, 11, o 12 con 
dos dados? 

5. Una mano de poker contiene cuatro corazones y una espada. La espada se rechaza y 
se toma un naipe de los restantes de la baraja. Calcular la probabilidad de sacar un 
quinto corazón. 

6. En el poker, una escalera son cinco cartas consecutivas no necesariamente del mismo 
palo. Si una mano contiene cuatro cartas consecutivas (pero no A234 o JQKA) y una 
quinta çarta no consecutiva a las otras, calcular la probabilidad de lograr la escalera, al 
devolver la quinta carta y pedir una nueva. 

7. Una mano de poker contiene cuatro de las cinco cartas en sucesión pero con un «salto» 
intercalado (por ejemplo, 5689), la quinta carta se devuelve y se toma otra nueva del 
resto de la baraja. Calcular la probabilidad de conseguir llenar el «hueco intermedio». 

8. Una urna contiene A bolas blancas y B bolas negras. Una segunda urna contiene C bolas 
blancas y D bolas negras. Se saca al azar un bola de la primera urna y se echa en la 
segunda urna. Seguidamente se extrae al azar una bola de la segunda urna. Calcular 
la probabilidad de cada uno de los sucesos siguientes: 

a) La primera bola es blanca. 

b) La primera bola es negra. 

c) La segunda bola es blanca, habiendo sido blanca la bola transferida. 

d) La segunda bola es blanca, habiendo sido negra la bola transferida. 

9. Se extraen dos bolas de una urna devolviendo Ia bola después de la primera extracción. 
La urna contiene cuatro bolas rojas y dos blancas. Calcular la probabilidad de cada 
uno de los sucesos siguientes. 

a) Ambas bolas son blancas. 

b) Ambas bolas son rojas. 

c) Ambas bolas son del mismo color. 

d) Por lo menos una bola es roja. 

10. Sea P„ la probabilidad de que ocurran exactamente n sucesos de los A y B, tomando n 
los valores 0, 1,2. Expresar cada uno de los números Po, Pi, Pz en función de P(A), 
P(B) y P(A n B). 

Puntos a favor. Algunos juegos de azar se expresan en función de la «suerte a favor» 
o «puntos a favor» mejor que en función de las probabilidades. Por ejemplo, si lanzamos 
un dado, la probabilidad de sacar un tres esl/6.Los resultados posibles son seis, uno de 
ellos es favorable y cinco desfavorables. Esto a menudo se expresa diciendo que la suerte 
a favor del suceso está como 1 a 5, o que la suerte en contra es de 5 a 1. Entonces suele 
relacionarse ésta con la probabilidad mediante la igualdad 

1 _ 1 
6 “1+5' 

En general, si A es un suceso con probabilidad P(A) y si a y b son dos números reales 
que 

03.6) P(A) = > 

a + b 

decimos que la suerte a favor de A es de a a b, o que la suerte en contra de A es de b a a. 
Puesto que 1 — aj(a + b) = b/(a + b), la suerte en contra de A es la misma que la suerte 
a favor del suceso complementario A'. E1 ejercicio siguienle está dedicado a otras propie- 
dades de este concepto de «los puntos o casos favorables» y sus relaciones con las proba- 
bilidades. 
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11. Si P(A) = 1, probar que (13.6) sólo puede satisfacèrse si b = 0 y a ^ 0. Si P(A) ^ 1, 
demostrar que existen infinidad de elecciones posibles de a y b que satisfacen (13.6) 
pero que todas tienen la misma razón a/b. 

12. Calcular los puntos a favor de cada uno de los sucesos descritos en el ejercicio 2. 

13. Dados los sucesos A y B. Si la suerte en contra de A es de 2 a 1 y a favor de A u B 
de 3 a 1, demostrar que 




Dar un ejemplo en el que P(B) = y otro en el que P(B) = f. 

13.10 Algunos principios básicos de análisis combinatorio 

Muchos problemas del cálculo de probabilidades y de otras ramas de la Mate- 
mática pueden reducirse a problemas de recuento del número de elementos de un 
conjunto finito. Los métodos sistemáticos para estudiar tales problemas forman 
parte de una disciplina matemática conocida con el nombre de análisis combina- 
torio. En esta sección nos referimos brevemente a algunas ideas fundamentales de 
análisis combinatorio que son útiles al analizar algunos de los más complicados 
problemas de la teoría de la probabilidad. 

Si tenemos a la vista todos lcs elementos de un conjunto finito, no resulta 
difícil contar el número de los mismos. Sin embargo, muy a menudo, un conjunto 
se describe de tal manera que es imposible «ver» todos sus elementos. Por ejem- 
plo, deseamos conocer el número de manos de bridge distintas que se pueden 
repartir. Cada jugador recibe 13 naipes de los 52 de la baraja. E1 número posible 
de manos distintas es el mismo que el de subconjuntos distintos de 13 elementos 
distintos que se pueden formar con un conjunto de 52 elementos también distin- 
tos. Ya que este número supera los 635 mil millones, la enumeración directa de 
todas las posibilidades no es el mejor método de atacar el problema; no obstante, 
con el Análisis combinatorio puede resolverse sin difìcultad. 

Este problema es un caso particular del problema más general de calcular el 
número de subconjuntos distintos de k elementos que pueden formarse con un 
conjunto de n elementos (*), siendo n > k. Designemos este número por f(n, k). 
Ya es conocido que 

(13.7) /("> fc ) = Q , 

donde, como de costumbre, (%) representa el coeficiente binómico, 

( fc ) = k! (n — k)!' 

(*) Cuando decimos que un conjunto tiene n elementos, significamos que consta de n 
elementos distintos. 
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En el problema de las manos de bridge tenemos /(52, 13) = (ff) =635 013 559 600 
manos distintas que un jugador puede recibir. 

Existen muchos métodos conocidos para llegar a (13.7). E1 más directo con- 
siste en formar cada subconjunto de k elementos eligiendo éstos uno a uno. Exis- 
ten n posibilidades en la primera elección, n — 1 en la segunda, y n — (k — 1) en 
la Â:-ésima. Si efectuamos todas las elecciones posibles de esta manera, obtenemos 
un total de 


n(n - 1) • • • (n - k + 1) = -- 

(n - k)\ 

subconjuntos de k elementos. Naturalmente, no todos esos conjuntos son distintos. 
Por ejemplo, si k = 3 los seis subconjuntos. 

{a, b, c}, {b, c, á), {c, a, b }, {a, c, b}, {c, b, a}, {b, a, c} 

son todos iguales. En general, con este método, cada subconjunto de k elementos 
se cuenta exactamente k\ veces.(*). Por consiguiente, debemos dividir el número 
nì/(n — k) por k\ para obtener f(n,k). Esto nos da f(n,k) = (£), como se 
afirmó. 

Este razonamiento es más o menos característico del Análisis combinatorio 
que se precisa en las próximas secciones. Por consiguiente, parece natural comen- 
tar brevemente los principios fundamentales en los que se apoya este Análisis. 

A menudo nos interesa contar el número de elementos del producto carte- 
siano de n conjuntos finitos E1 producto cartesiano se representa 

con el símbolo Âi X ... X A„ y se define así: 

A x x • • • x A„ = {(a ly ..., a„) | a^ e ., a n e A n }. 

Esto es, el producto cartesiano consta del conjunto de todas las n-plas ordenadas 
(ai,..., a„) en las que el À:-ésimo elemento de cada n-pla procede del fc-ésimo 
conjunto A*. 

En la figura 13.1 se muestra un ejemplo con n = 2. En él Ai — {1, 2, 4, 5} 
y A 2 = {1, 3}. Existen 4 elementos en Ai y 2 en A 2 , dando un total de 8 elemen- 
tos en el producto cartesiano A, X A z . Con mayor generalidad, si Ai consta de kt 
elementos y A 2 de k 2 elementos, entonces A 2 X A 2 constará de kik 2 elementos. 
Por inducción respecto a n, se deduce que si A r consta de k r elementos, el pro- 
ducto cartesiano A 2 X ... X A„ constará de ki... k„ elementos. 

Para expresar este resultado en la terminología de las funciones de conjunto, 
sea 3? la clase de todos los conjuntos finitos y v la función de conjunto definida 

(*) En el ejemplo 3 en la página 590, se ve con claridad la explicación de esto, y 
damos una deducción de (13.7) más rigurosa. 
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sobre así: Si Ae &, v(/4) representa el número de elementos distintos de A. 
(Para el conjunto vacío definimos v(0) = 0.) Es entonces fácil comprobar que v 
es una función de conjunto de aditividad finita, podemos pues escribir, 

(13.8) v(Û S,) =Ìv(S,) 

si {Si, S 2 ,...,S„} es una colección de conjuntos finitos disjuntos (esto es, si 
S, n S 3 = 0 siempre que i ¥=■ /). E1 número de elementos de un producto carte- 
siano puede expresarse en función de v como sigue: 

v(Aj. x A 2 x • • • X A„) = v(A!)v(A 2 ) ■ ■ ■ v(A„). 


a 2 


3- 

A 2 ={ 1,3} 2- 

1- 










_ 




I : 

A, 

>345 

= 0,2,4, 5} 


Figura 13.1 Producto cartesìano de dos conjuntos. Los puntos marcados representan 
Ai X Á 2 . 


Una fórmula parecida nos dice cómo contar el número de elementos de cualquier 
conjunto T de n-plas si conocemos el número de elecciones posibles para cada una 
de las sucesivas componentes. Por ejemplo, supongamos que existen /c, elecciones 
posibles para el primer componente Xi. Sea k 2 el número de elecciones posibles 
para x 2 , una vez x, es conocido. Análogamente, k, sea el número de elecciones po- 
sibles para x„ una vez x lt x 2 ,..., x,~i han sido elegidos. E1 número de n-plas 
que pueden formarse con estas elecciones es: 


v(T) = k t k 2 •■■k„. 
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Esta fórmula se denomina frecuentemente regla del cálculo secuencial. Puede de- 
mostrarse por inducción. En muchas aplicaciones el conjunto de elecciones para x, 
puede ser difícil de precisar, pues no puede determinarse hasta después de haber 
elegido los componentes anteriores. (Este es el caso del cálculo de las manos de 
bridge.) Afortunadamente, al aplicar la regla del cálculo secuencial no necesita- 
mos conocer ese conjunto de elecciones de x„ sino únicamente el número de elec- 
ciones posibles para x„ 

La propiedad aditiva expresada por la fórmula (13.8) y la regla del cálculo 
secuencial nos proporcionan la solución de muchos problemas de cálculo. En los 
ejemplos siguientes vamos a ver el modo de aplicarlos. 

ejemplo 1. Muestreo con reposición. Sea un conjunto S que conste de n 
elementos. Si 1, ^cuántas k- plas pueden formarse si-cada componente puede 
ser un elemento cualquiera de S? 

Observación. Puede ser útil imaginar S como una urna que contenga n bolas nu- 
meradas 1,2, ...,n. Sacamos una bola y tomamos su marca como primer compo- 
nente de nuestra fc-pla. Devolvemos la bola a la urna, volvemos a sacar otra bola 
y tomamos su marca como segunda componente y así sucesivamente, hasta que 
hemos completado k extracciones. De este modo, la misma marca puede aparecer 
varias veces en la k- pla formada. 

Solución. Cada k- pla es un elemento del producto cartesiano 
T= Sj X X S k , 

siendo cada S, = S. Recíprocamente, cada elemento de T es una de las fc-plas que 
consideramos. Luego el número de las A:-plas formadas de este modo es 

v(T) = viS,) ■ • • v(S*) = n k . 

ejemplo 2. Muestreo sin reposición. Dado un conjunto S de n elementos. 
Si k^n, icuántos L-plas pueden formarse si los componentes se eligen en S sin 
reposición, es decir, si ningún elemento de S puede usarse más de una vez en una 
misma fc-pla? 

Solución. Para el primer componente x s existen n elecciones posibles (los n 
elementos de S). Una vez elegido Xi, quedan n — 1 elecciones posibles para x 2 . 
Elegido x 2 , que dan n — 2 posibilidades para x 3 , y así sucesivamente, para xt ten- 
dremos n — k + 1 posibilidades de elección. Por lo tanto, según la regla del 
cálculo secuencial, el número total de A:-plas así formadas es: 

n(n -IX» - 2) •••(!. -k+ 1) = —^—. 

(n - k)\ 
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En particular, cuando k = n resultan n! n-plas distintas. 

ejemplo 3. Número de subconjuntos de k elementos de un conjunto dado 
de n elementos. Si k^n, ^cuántos subconjuntos distintos de k elementos pueden 
formarse a partir de un conjunto dado S de n elementos? 

Solución. Designemos por r el número de subconjuntos en cuestión y éstos 
por 


A lt Ai ,... ,A,. 

Estos conjuntos son distintos, pero no necesariamente disjuntos. Calcularemos r en 
función de n y k por un método indirecto. A tal fin, designemos con 6, la colec- 
ción de k -plas que pueden formarse eligiendo los componentes entre los elementos 
de Ai sin reposición. Los conjuntos B u B 2 ,... ,B r son disjuntos. Además, si apli- 
camos el resultado del ejemplo 2 con n = k tenemos: 


Pongamos ahora 


v(B,) = k\ para cada / = 1,2. r. 

r=5,Ufi ! U'"U5 r 


Este conjunto T consta de todas las A:-plas que se pueden formar eligiendo los 
componentes en S sin reposición. Del ejemplo 2. tenemos: 


v(T) = n\l(n-k)\ 

y por la aditividad tenemos también. 


v(T)~Ìv(Bà = k\ r . 

Igualando las dos expresiones de v(T) obtenemos: 

k\(n — k)\ ( fe ) 

Esto demuestra la fórmula (13.7) establecida antes en esta sección. 

Si utilizamos el resultado del ejemplo 3 para calcular el número total de sub- 
conjuntos de un conjunto S que consta de n elementos, obtenemos: 
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Ya que esta suma también se obtiene al desarrollar (1 + 1)" por la fórmula bino- 
mial, el número de subconjuntos de S es 2". 

13.11 Ejercicios 

1. Sea A = {1,2,3}. Desarrollar según la notación en lista el conjunto de pares ordenados 
(a, b) obtenidos eligiendo el primer componente en A y el segundo componente entre 
los restantes elementos de A. Tal conjunto de pares ordenados, ipuede expresarse en 
forma de producto cartesiano? 

2. Una pareja de naipes puede ser obtenida de una baraja de 52 naipes, de 52 ■ 51 = 2652 
maneras. Determinar el número de parejas distintas y exponer el razonamiento. 

3. Un comité del Senado norteamericano que consta de seis demócratas y cuatro republi- 
canos debe elegir un presidente y un vicepresidente. iDe cuántas maneras se pueden 
elegir este par de funcionarios si el presidente debe ser demócrata? 

4. Un juego consiste en tirar una moneda dos veces y lanzar luego un dado. Expresar 
cada resultado de este experimento como una tema ordenada (a, b, c), donde cada a y b 
pueden ser o C (cara) o + (cruz) y c es el número de puntos que marca el dado. 
por ejemplo (C,C, 3) signifìca que ha salido cara en ambas tiradas y el dado ha mar- 
cado el 3. Expresar el conjunto de todos los resultados posibles como producto carte- 
siano y determinar el número de resultados posibles. 

5. iDe cuántas maneras puede repartirse una baraja de bridge de 52 naipes en cuatro 
manos de 13 naipes? Exponer el ìazonamiento. 

6. Se lanzan dos dados, uno rojo y uno blanco. Representar el resultado como un par 
ordenado (a,b), donde a representa el número de puntos del dado rojo, y b los del 
blanco. iCuál es el número posible de pares ordenados (a, b)? (.Cuántos de esos cum- 
plen la condición de que la suma a + b es: 

a) ipar? b) (.divisible por 3? c) ipar o divisible por 3? 

7. Una mano de poker contiene cinco naipes repartidos de una baraja de 52. (.Cuántas 
manos distintas pueden repartirse que contengan: 

a) ^dos parejas (por ejemplo, 2 reyes, 2 ases y un 3)? 

b) iun flux (cinco cartas de un mismo palo)? 

c) Âuna escalera de un mismo palo (cinco cartas consecutivas de un mismo palo, no 
incluyendo el «10», la sota, la reina, el rey y el as)? 

d) iuna escalera real («10», sota, reina, rey, as de un mismo palo)? 

8. En relación con el ejercicio 7. Calcular la probabilidad para que una mano de poker sea: 

a) un flux. 

b) una escalera de un mismo palo. 

c) una escalera real. 

9. tCuántos comités de 50 senadores norteamericanos pueden formarse que contengan: 

a) i.un solo senador de Alaska? 

b) tdos senadores de AIaska? 

10. Un comité de 50 senadores se elige al azar. Calcular la probabilidad de que queden 
incluidos Ios dos senadores por Alaska. 

11. Se forman grupos de cuatro símbolos puestos en lfnea. Cada símbolo puede ser punto 
o raya. tCuántos grupos pueden formarse? 

12. tCuántas palabras de k letras pueden formarse con un alfabeto que contiene n letras? 

13. Demostrar que: 
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14. Supongamos que un conjunto de pares ordenados (a, b) se ha construido eligiendo el 
primer componente en un conjunto de k elementos, por ejemplo, del conjunto 
{ûi,.. . ,a k }, y el segundo componente en un conjunto de m elementos {b \,... ,b„}. 
Existen m pares con el primer componente ai, esto es, (ai.bi),... ,(ai,b„). Del mismo 
modo, hay m pares (a if b\), ..., (au b„) con el primer componente a t . Por lo tanto, el 
número total de pares ordenados (a, b) es m + m + ... +m (k sumandos). Esta suma 
vale km, que prueba Ia regla del cálculo secuencial para conjuntos de pares ordenados. 
Por inducción demostrar la regla para conjuntos de n-plas ordenadas. 


13.12 Probabilidades condicionadas 

Se lanza un dado correcto y se sabe que el resultado es un número par. 
^Cuál es la probabilidad de que este número sea divisible por 3? ^Cuál es la 
probabilidad de que una criatura padezca daltonismo, en el supuesto de que es 
un nino? Estas preguntas pueden formularse en la siguiente forma: Sean A y B 
sucesos de un espacio muestral S. Si ocurre B, £cuál es la probabilidad de que 
ocurra A? Esto no es lo mismo que preguntar cuál es la probabilidad del suceso 
A C\ B. En realidad cuando A = B la pregunta es: Si A ocurre, £cuál es la proba- 
bilidad de que A ocurra? La contestación sería en este caso 1, y ésta puede ser o 
no la probabilidad del suceso A n B. Para tratar tales problemas en general, 
volvamos al caso del dado. 

Cuando nos ocupamos de cuestiones de probabilidad relativas al lanzamiento 
de un dado, utilizamos ordinariamente como espacio muestral S={ 1, 2, 3, 4, 5, 6} 
y asignamos la probabilidad % a cada elemento de S. E1 suceso «divisible por 3» 
es el subconjunto A = {3, 6} y el suceso «par» es el subconjunto B = {2, 4, 6}. 
Deseamos conccer la probabilidad de que un elemento esté en A, sabiendo ya que 
está enB. Ya que estamos interesados en resultados en los que el número es par, 
prescindimos de los resultados 1, 3, 5 y utilizamos, en lugar de S, el conjunto 
B = {2, 4, 6} como espacio muestral. E1 suceso que nos interesa es tan sólo el 
conjunto de un elemento (6), que es el único resultado del nuevo espacio muestral 
divisible por 3. Si todos los resultados de B se consideran igualmente probables, 
hay que asignar a cada uno de ellos la probabilidad %, luego la probabilidad de 
{6} es también \' 3 . 

Obsérvese que se ha resuelto el problema anterior empleando una idea muy 
elemental. Simplemente hemos cambiado el espacio muestral S por el B y se ha 
procedido a nueva asignación de probabilidades. Esto nos sugiere la manera de 
generalizar el procedimiento. 

Sea (S, S9, P ) un espacio de probabilidad dado. Sean A y B dos sucesos y 
planteémonos la siguiente cuestión: «Si B acontece, i,cuál es la probabilidad de 
que ocurra A?» Como en el anterior ejemplo, podemos cambiar el espacio mues- 
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tral S por el B y asignar nuevas probabilidades. Para el mismo B asignamos la 
probabilidad 1. Puesto que nos interesan los elementos de A que pertenecen al 
nuevo espacio muestral B, nuestro problema es calcular la probabilidad del suceso 
A n B según las nuevas probabilidades asignadas. Esto es, si P' representa la fun- 
ción de probabilidad asociada al nuevo espacio muestral B, tenemos que calcular 
P\A n B). 

Demostraremos ahora que si F(B) ¥ 0 siempre podemos definir una función 
de probabilidad P' y un álgebra booleana 38’ de subconjuntos de B de modo que 
(B, /A' , P') sea un espacio de probabilidad. Como álgebra ÔS' tomamos la colec- 
ción de todos los conjuntos T n B donde T es un conjunto que pertenece al álge- 
bra booleana original á?. Es fácil comprobar que la âS', así definida, es realmente 
un álgebra booleana. Una manera de definir una función de probabilidad P' so- 
bre SS' consiste en dividir cada una de las antiguas probabilidades por P(B). Esto 
es, si Ceâd' ponemos 




(Esto en la hipótesis de que P(B) ¥ 0.) Lo que hemos hecho sólo ha sido modifi- 
car la escala, con todas las probabilidades multiplicadas por el factor 1 /P(B). Es 
fácil comprobar que esta definición de P’ nos da una medida de probabilidad. 
Es evidentemente no negativa y asigna la probabilidad 1 a B. La propiedad aditiva 
resulta inmediatamente de la de P. 

Puesto que cada C de 38' es de la forma A n B, donde A es un suceso en 
el espacio muestral original S, podemos dar a la definición de P' esta otra forma: 


P'(A n B) = 


P(A n B) 
P(B) 


Esta discusión sugiere que el cociente P(A n B)IP(B) nos proporciona una justa 
medida de la probabilidad de que ocurra A, en el supuesto de que B haya ocurrido. 
La definición que sigue está hecha con esta intención: 


definición de probabilidad condicionada. Sea (S, 38, P) un espacio de 
probabilidad y B un elemento tal que P(B) ¥ 0. La probabilidad condicionada de 
que un suceso A ocurra, en el supuesto de que B ha ocurrido, se representa me- 
diante el símbolo P(A\B) (léase: «la probabilidad de A, dado B») y se define por 
la igualdad 


P(A | B) = 


P(A n B) 
P(B) 


La probabilidad condicionada P(A\B) no está definida si P(B) = 0. 
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Los ejemplos que siguen ilustran el uso del concepto de probabilidad condi- 
cionada. 

ejemplo 1. Consideremos una vez más el problema antes mencionado: Se 
lanza un dado y se sabe que el resultado es un número par. /.Cuál es la probabili- 
dad de que ese número sea divisible por 3? Podemos tomar por espacio muestral 
S = {1, 2, 3, 4, 5, 6} y asignar la probabilidad \ a cada elemento de S. E1 suceso 
«par» es el conjunto B = {2, 4, 6} y el suceso «divisible por 3» es el conjunto 
A = {3, 6}. Por consiguiente: 


P(A | B) = 


P(A n B) 
P(B) 


1/6 = 1 

3/6 3' 


Esto está de acuerdo con la anterior solución en la que se tomó B como espacio 
muestral y se asignó la probabilidad % a cada elemento de B. 

ejemplo 2. Se trata de un ejemplo típico usado en el Departamento de 
Biología de Caltech para prevenir contra los errores de las estadísticas superficiales. 
Para «demostrar» estadísticamente que la población de los Estados Unidos con- 
tiene más ninos que ninas se pide a cada estudiante que cite el número de ninos 
y ninas de su familia. Invariablemente, el número total de ninos excede al de ninas. 
Las estadísticas en este caso son parciales ya que todos los estudiantes de bachi- 
llerato en Caltech son varones. Por lo tanto, la cuestión que aquí se considera no 
es precisamente la probabilidad de que una criaturá sea nino, sino más bien la 
probabilidad de que una criatura sea nino en el supuesto que procede de una 
familia que por lo menos tiene un nino. 

Para calcular las probabilidades en un ejemplo de este tipo consideremos una 
muestra de 4 n familias, cada una con dos hijos. Supongamos que n familias tie- 
nen 2 ninos, 2 n familias un nifio y una nifia, y n familias 2 nifias. E1 espacio 
muestral S es el conjunto de las 8« criaturas de esas familias y asignemos la pro- 
babilidad P(x) = l/(8n) a cada x de S. Designemos por A el suceso «la criatura 
es nifio» y por B «la criatura procede de una familia con un nifio por lo menos». 
La probabilidad P(A) es 1/2. Análogamente P(B) = 3/4 ya que 3 n de las 4 n fami- 
lias tienen por lo menos un nifio. Por lo tanto la probabilidad de que una criatura 
sea nifio, dado que procede de una familia con un nifio por lo menos, es la proba- 
bilidad condicionada 


P(A | B) = 


P(A n B) 
P(B) 


P(A) 

P(B) 


1/2 

3/4 


2 
3 ' 
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13.13 Independencia 

Un concepto importante relacionado con el de probabilidad condicionada, es 
el de independencia de sucesos, que puede definirse como sigue: 

definición de independencia. Dos sucesos A y B se llaman independientes 
(o estocásticamente independientes) si, y sólo si, 

(13.9) P(A r\B) = P(A)P(B). 

Si A y B son independientes, P(A\B) = P(A) si P(B) ¥= 0. Esto es, la proba- 
bilidad condicionada de A, dado B, es la misma que la probabilidad «absoluta» 
de A. Esta relación pone de manifiesto el significado de la independencia. E1 cono- 
cimiento de que B ha ocurrido, no influye en la probabilidad de que A ocurra. 

ejemplo 1. Una carta es extraída de una baraja de 52. Cada carta tiene la 
misma probabilidad de ser seleccionada. Demostrar que los dos sucesos «sacar un 
as» y «sacar un corazón» son independientes. 

Solución. Elegimos un espacio muestral S de 52 elementos y asignamos la pro- 
babilidad a cada elemento. E1 suceso A, «sacar un as» tiene la probabilidad 
P(A) = 5 ~ 2 = 2 ~ 3 . E1 suceso B, «sacar un corazón» tiene la probabilidad P(B) = 
M = {. E1 suceso A r\ B significa «sacar el as de corazones», que tiene la pro- 
babilidad satisface la igualdad (13.9) y los sucesos A y B son independientes. 

ejemplo 2. Se lanzan independientemente tres dados «correctos», de modo 
que cada combinación sea igualmente probable. Sea A el suceso consistente en que 
la suma de los dígitos obtenidos sea seis y B el que los tres dígitos sean distintos. 
Determinar si estos dos sucesos son independientes o no. 

Solución. Como espacio muestral S tomamos el conjunto de todas las ternas 
( a, b, c) pudiendo a, b y c tomar los valores 1, 2, 3, 4, 5, 6. En S existen 6* ele- 
mentos, y puesto que son igualmente probables asignamos la probabilidad 1 /6 3 a 
cada uno. E1 suceso A es el conjunto de todas las ternas (a, b, c) tales que 
a + b + c = 6. Por enumeración directa vemos que hay 10 ternas de esta índole, 
a saber: 


(1.2.3) , (1,3,2), (1,1,4), (1,4, 1), 

(2.1.3) , (2, 3,1), (2, 2,2), 

(3, 1,2), (3, 2, 1), 

(4,1,1). 
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E1 suceso B consta de todas las temas ( a, b, c) para las que a ¥= b, b¥= c, y 
a¥ c. Existen 6 • 5 ■ 4 = 120 elementos en B. Exactamente seis de esos elementos 
pertenecen a A, de manera que À n B tiene seis elementos. Por lo tanto, 

P(AnB) = £, P(A) = l £, y P(B) = ^. 

6 6 6 

En este caso P(A n B) ¥ P(A)P(B); luego los sucesos A y B no son indepen- 
dientes. 

Para más de dos elementos se define la independencia del modo siguiente. 
Una colección finita s/ de n sucesos se dice que es independiente si los sucesos 
satisfacen la propiedad multiplicativa 

(13.10) P(ÍU) =ÏÏP(A k ) 

para toda subcolección finita {A u A 2 ,..., A m }, donde m puede tomar los valores 
m = 2, 3 ,..., n, y los conjuntos Ai pertenecen a sí. 

Cuando sé consta exactamente de tres sucesos A, B y C, la condición de inde- 
pendencia (13.10) exige que 

(13.11) P(A n B) = P(A)P(B), P(A nC) = P(A)P(C), P(B n C) = P(B)P(C), 

y 

(13.12) P(A n B n C) = P(A)P(B)P(C). 

Puede pensarse que las tres igualdades (13.11) son suficientes para que se 
satisfaga (13.12) o, en otras palabras, que la independencia de tres sucesos es una 
consecuencia de la independencia a pares. Esto no es cierto, como puede verse con 
el siguiente ejemplo: 

Cuatro tickets con las marcas a, b, c y jibc, se colocan en una caja. Se extrae 
un ticket al azar, y el espacio muestral es: 

S = {a, b, c, abc}. 

Los sucesos A, B y C se definen como sigue: 

A = {a, abc }, B = {b, abc}, C = {c, abc}. 

Esto significa, que el suceso X consiste en la extracción de un ticket que contiene 
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la letra x. Es fácil comprobar que cada una de las tres igualdades (13.11) se satis- 
face de manera que los sucesos A,B,yC son independientes a pares. Sin embargo, 

(13.12) no se satisface y por consiguiente los tres sucesos no son independientes. 
Los cálculos son sencillos y los dejamos como ejercicio para el lector. 

13.14 Ejercicios 

1. Sean A y B dos sucesos con P(A) * 0, P(B) * 0. Demostrar que 

(13.13) P(A r\ B) — P(B)P(A \ B) = P(A)P(B \ A). 

Algunas veces es más fácil calcular las probabilidades P(A) y P(B\A) directamente enu- 
merando los casos que calcular P(A n B). Cuando esto ocurre, la igualdad (13.13) nos da 
un método adecuado para calcular P(A n B). En el próximo ejercicio damos un ejemplo. 

2. Una urna contiene siete bolas blancas y tres negras. Una segunda urna contiene cinco 
blancas y cinco negras. Se extrae al azar una bola de ia primera urna y se coloca en 
la segunda. A continuación se extrae al azar una bola de la segunda urna. Represen- 
temos con A el suceso «bola negra en la primera extracción» y con B el suceso 
«bola negra en la segunda extracción». 

a) Calcular las probabilidades P(A) y P(B\A) directamente por enumeración de los 
casos posibles. Utilizar la igualdad (13.13) para calcular P(A n B). 

b) Calcular directamente/ > (/l n B) enumerando todos los pares de extracciones posibles. 

3. a) Sean Ai.A2.A3 tres sucesos tales que P(A\ n A 2 ) ¥■ 0. Demostrar que 

P(A X n A 2 n A 3 ) = P(A\)P(A 2 \ A 2 )P(A 9 \ A, n A 2 ). 

b) Generalizar por inducción este resultado como sigue: Si A\, A2 ,..., A„ son n su- 
cesos (n > 2) tales que P(A\ n A 2 n ■ ■ ■ n A 0, entonces, 

P(A\ n A 2 n ■ ■ ■ n A n ) = P(A 3 )P(A 2 \ A\)P(A a \ A\ n A 2 ) ■ ■ ■ P(A n | A x n A 2 n ■ ■ ■ n A n _\). 

4. Un comité de 50 senadores se elige al azar. Hallar la probabilidad de que los dos 
senadores por Alaska queden incluidos, dado que por lo menos uno ya lo está. 

5. Una urna contiene cinco bolas doradas y siete azules. Se extraen al azar dos bolas (sin 
devolverlas a la urna). Si la primera bola es dorada, calcular la probabilidad de que 
la segunda sea también dorada. 

6. Un baraja es repartida en cuatro manos de 13 naipes cada una. Si una mano tiene 
exactamente siete espadas, £cuál es la probabilidad de que una determinada de las 
otras manos contenga a) por lo menos una espada, b) por lo menos dos espadas, c) un 
palo completo? 

7. Demostrar que P(A u B | C) = P(A \ C) + P(B \ C) — P(A n B\C). 

8. Sean A\, A2, ■. ■, A„ n sucesos disjuntos cuya reunión es el espacio muestral S comple- 
to. Para todo suceso E tenemos la igualdad 


E = E n S = E n\J Ai = \J (E n A { ). 
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Esta igualdad establece que E puede* ocurrir tan sólo en conjunción con algún A,. De- 
mostrar que 

a) P(E) =^P(E nA{). 

b) P(E) = 2 P(E | Af)P(A{). 

Esta fórmula es útil cuando las probabilidades condicionadas P(E\A,) son más sencillas 
de calcular que P(E). 

9. Una moneda «correcta» es lanzada repetidamente. Sale cara en los seis primeros lanza- 
mientos. iCuál es la probabilidad de que salga cara en el séptimo? 

10. Dados los sucesos independientes A y B cuyas probabilidades no son 0 ni 1. Demostrar 
que A' y B' son independientes. iOcurre lo mismo si A o B tienen probabilidad 0 ó 1? 

11. Dados los sucesos independientes A y B. Probar o rechazar, según convenga en cada 
caso, que: 

a) A' y B son independientes. 

b) A u B y A n B son independientes. 

c) P(A uS)= 1 — P(A')P(B'). 

12. Si Ai, A2,. ■ ■ ,Ar son sucesos independientes, demostrar que 

A^ + J\P(A' i ) - 1. 

13. Si tres sucesos A, B, y C son independientes, demostrar que A 'J B y C son indepen- 
dientes. [ Indicación. Utilizar el resultado del ejercicio 7 para demostrar que 
P(A u B | C) = P(A u B).] 

14. Sean A y B dos sucesos, ninguno de los cuales tiene probabilidad 0. Demostrar que son 
ciertas o que no lo son cada una de Ias afirmaciones siguientes: 

a) Si A y B son disjuntos, A y B son independientes. 

b) Si A y B son independientes, A y B son disjuntos. 

15. Se lanza un dado dos veces, el espacio muestral consta de 36 posibles pares de resulta- 
dos ( a, b) cada uno con probabilidad Sean A, B y C los sucesos siguientes: 

+ = {(a, b) | a es impar}, B = {(a, b) \ bes impar}, C = {(a, b)\a + be s impar}. 

a) Calcular P(A), P(B), P(C), P(A n B),P(A n C),P(B n C), y P(A nB nC). 

b) Demostrar que A, B y C son independientes a pares. 

c) Demostrar que A, B y C no son independientes. 


13.15 Experimentos o pruebas compuestas 

Volvamos ahora al problema de de Méré mencionado en la introducción —si 
es lo mismo apostar la misma cantidad a favor o en contra de la aparición por lo 
menos de un «doble seis» en 24 tiradas de un par de dados. Tratemos el problema 
de un modo más general: iCuál es la probabilidad de conseguir un doble seis 
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por lo menos una vez en n tiradas de un par de dados? £Esta probabilidad es ma- 
yor o menor que un medio cuando n = 24? 

Consideremos en primer lugar la prueba consistente en lanzar un par de 
dados una sola vez. E1 resultado de este juego puede representarse mediante pares 
ordenados (a, b) en los que a y b recorren los valores 1, 2, 3, 4, 5, 6. E1 espacio 
muestral S consta de 36 de esos pares. Puesto que los dados son correctos asig- 
namos a cada par de S la probabilidad %6- 

Supongamos que lanzamos los dados n veces. La sucesión de las n pruebas 
es una prueba compuesta que queremos describir matemáticamente. Por ello nece- 
sitamos un nuevo espacio muestral y una correspondiente medida de probabilidad. 
Consideremos los resultados del nuevo juego como n-plas ordenadas (Xi ,. . ., x„), 
en donde cada componente v, es uno de los resultados del espacio muestral origi- 
nal S. Es decir, el espacio muestral para la prueba compuesta es el producto car- 
tesiano S X . .. X S, que se representa por S". E1 conjunto S" tiene 36" elemen- 
tos, y asignamos igual probabilidad a cada elemento: 

si ,6S '- 

Nos interesa el suceso «por lo menos un doble seis en n tiradas.» Designé- 
moslo por A. En este caso es más sencillo calcular la probabilidad del suceso 
complementario A', que significa «ningún doble seis en n tiradas.» Cada elemento 
de A' es una w-pla, cada uno de cuyos componentes pueden ser cualquier elemento 
de S excepto (6, 6). Por consiguiente existen 35 valores posibles para cada com- 
ponente y por tanto (35)“ »-plas en total en A'. Puesto que cada elemento de A’ 
tiene probabilidad ( 3 - a ) n , la suma de todas las probabilidades puntuales en A’ es 
(f e)”- Esto nos da 


P(A) = 1 - P(A’) = 1 - (f£) n . 

Para contestar a la pregunta de de Méré tenemos que decidir si P(A) es mayor 
o menor que V 2 cuando n = 24. La desigualdad P(A) ^ V 2 es equivalente a 
1 — (tt)" ^ V2» 0 (||)” < V 2 . Tomando logaritmos encontramos 

n log 35 — « log 36 < —log 2, o n> --= 24.6+. 

log 36 — log 35 

Por consiguiente P(A) < V 2 cuando n = 24 y P(A) > V 2 cuando n > 25. No es 
ventajosa una apuesta de una cantidad al suceso de que por lo menos se presente 
un doble seis en 24 tiradas, frente a la apuesta de la misma cantidad al suceso 
contrario. 

Esta discusión sugiere un método general para tratar los experimentos sucesi- 
vos. Si una prueba se repite dos o más veces, el resultado puede considerarse 
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como una prueba compuesta. Más general, una prueba compuesta puede ser el 
resultado de ejecutar dos o más pruebas distintas sucesivamente. Cada una de las 
pruebas individuales puede estar relacionada con cada una de las otras o pueden 
ser estocásticamente independientes, en el sentido de que la probabilidad del re- 
sultado de cada una de ellas no depende de los resultados de las otras. 

Por simplicidad, discutiremos cómo se pueden combinar dos pruebas inde- 
pendientes en una prueba compuesta. La generalización a más de dos experiencias 
será evidente. 

Para asociar el espacio de probabilidad natural a una prueba o experiencia 
compuesta, debemos definir el nuevo espacio muestral S, la correspondiente álge- 
bra booleana 88 de subconjuntos de S, y la medida de probabilidad P sobre 
Como en el ejemplo anterior, usamos el concepto de producto cartesiano. 

Sean (S ^, 88 x , PJ y (S 2 , á? 2 , P 2 ). dos espacios de probabilidad asociados a 
dos experiencias y E 2 . Con E representamos la experiencia o prueba compuesta 
para las que el espacio muestral S es el producto cartesiano Si X S 2 . Un resultado 
de E es el par (x, y) de S, donde el primer componente x es un resultado de Ei 
y el segundo y un resultado de E 2 . Si Si tiene n elementos y S 2 m, el producto 
Si X S 2 tendrá nm elementos. 

Como nueva álgebra booleana 88 tomamos la colección de todos los subcon- 
juntos de S. A continuación definimos la función de probabilidad P. Ya que S es 
finito podemos definir P(x, y) para cada punto (x, y) de S y utilizar la aditividad 
al definir P para los subconjuntos de S. Las probabilidades P(x, y) pueden asig- 
narse de varias maneras. Sin embargo, si dos pruebas E x y E 2 son estocástica- 
mente independientes, definimos P mediante la ecuación 

(13.14) P(x,ỳ) = Pi(x)P 2 (y) para cada (jc, y) de S. 

Se justifica esta definición del siguiente modo. Consideremos dos sucesos par- 
ticulares A y B del nuevo espacio S, 


8 = {(*i,yi), (x,,y 2 ),... , (r,,^)} 

y 

b = {(^i,yi), fe.ji), ■ • •, (^„,7i))- 

Esto es, A es el conjunto de todos los pares de Si X S 2 cuyo primer elemento es 
x lt y B es el conjunto de todos los pares cuyo segundo elemento es y,. La inter- 
sección de los dos conjuntos A y B es el conjunto de un solo elemento {(x^.y,)}. 
Si presentimos que el primer resultado x t no debe influir en el resultado y, parece 
razonable exigir que los sucesos A y B sean independientes. Esto significa que 
habrá que definir la nueva función de probabilidad P de manera que 
(13.15) p(A n B) = P(A)P(B). 
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Si decidimos la forma de asignar las probabilidades P(A) y P(B), la ecuaciór 

(13.15) nos dirá cómo asignar la probabilidad P(A n B), esto es, la probabilidad 
P(x,,yi). Se presenta el suceso A si y sólo si el resultado de la primera prueba es 
Xl . Puesto que Pi(xA es su probabilidad, parece natural asignar el valor P,(x 1 ) 
también a P(A). Análogamente, asignamos a P(B) el valor P 2 (y i). La ecuación 

(13.15) nos da entonces 


P(-Wi) = PÁxJPáyù- 

Todo esto es, naturalmente, tan solo una justificación para la asignación de 
probabilidades (13.14). E1 único camino para decidir si (13.14) es o no una acep- 
table asignación de probabilidades puntuales es ver si se cumplen las propieda- 
des fundamentales de las medidas de probabilidad. Cada número P(x, y) es no 
negativo, y la suma de todas las probabilidades puntuales es igual a 1, puesto que 
tenemos 


I P(x, y) = I Pi(x) ■ 2 P 2 (y) =1-1 = 1. 

(x.v)€-S xeS i yeS^ 

Cuando decimos que una prueba compuesta E está determinada por dos prue- 
bas £ t y £ 2 estocásticamente independientes, queremos decir que el espacio de 
probabilidad (S, 3$, P) está definido como acabamos de explicar, tal «indepen- 
dencia» queda reflejada en el hecho de que P(x, y) es igual al producto P,(x) P 2 (y). 
Puede demostrarse que la asignación de probabilidades (13.14) implicala igualdad 

(13.16) P(t/x V) = P^UỳPtiV) 

para todo par de subconjuntos U de âS x y V de 3S t . (Véase el ejercicio 12 de la 
sección 13.23 donde se esboza la demostración.) De esta forma deduciremos algu- 
nas consecuencias importantes. 

Sea A un suceso (de la prueba compuesta E) de la forma 

A = Q x S 2 , 

donde C, e 3S X . Cada resultado de A es un par ordenado (x, y) siendo x un resul- 
tado de C, (en la primera prueba £,) mientras que y puede ser cualquier resultado 
de S 2 (en la segunda prueba £ 2 ). Si aplicamos (13.16) encontramos: 

P(A) = P(Ci x S 2 ) = PiiCAP^) = PACd, 

ya que P 2 (S 2 ) = 1. De este modo la definición de P asigna la misma probabilidad 
a A que la asignada por Pj a C i. Por esta razón, se dice que un tal suceso A está 
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determinado mediante la primera prueba E L . Análogamente, si B es un suceso 
de E de la forma 


B = S L x C 2 , 

perteneciendo C 2 e á? 2 , tenemos: 

P(B) = P(S L x C 2 ) = P 1 (S' 1 )P 2 (C 2 ) = P 2 (C 2 ) 

y se dice que B está determinado por la segunda prueba E 2 . Demostraremos ahora, 
utilizando (13.16), que tales sucesos A y B son independientes. Esto es, tenemos: 

f 1 3.17) P(A n£) = P(A)P(B). 

Ante todo notemos que 

A n B = {(x,y) | (x,y) e C L x S 2 y (x,y) e x C 2 ) 

= {(x,j)|xeC, y ;eC,} 

= Cj x C 2 . 

Luego, en virtud de (13.16), tenemos: 

(13.18) P(A n B) = P(C t x C 2 ) = / > 1 (C 1 ) J P 2 (C 2 ). 

Puesto que PjíC,) = P(A) y P 2 (C 2 ) = P(B) obtenemos (13.17). Obsérvese que 
la igualdad (13.18) también demuestra que podemos calcular la probabilidad 
P(A n B) como producto de las probabilidades en cada uno de los espacios mues- 
trales S L y S 2 ; luego no son precisos cálculos con probabilidades en la prueba com- 
puesta. 

La generalización a pruebas o experiencias compuestas de n pruebas E u E 2 , 
... ,E n se deduce en la misma forma. Los puntos en el nuevo espacio muestral 
son n-plas (x u x 2 ,, x n ) y las probabilidades se definen como producto de las 
probabilidades de los resultados particulares 

(13.19) P(x L ,x 2 ,...,x n )= PÁxMxJ ■ ■ ■ P n (x n ). 

Cuando se adopta esta definición de P decimos que E está determinado por n prue- 
bas independientes E L , E 2 ,..., E n . En el caso particular en el que todas las 
pruebas están asociadas al mismo espacio de probabilidad, la prueba compuesta E 
es un ejemplo de pruebas independientes repetidas bajo idénticas condiciones. En 
la sección siguiente se considera un ejemplo. 
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13.16 Pruebas de Bemoulli 


Un ejemplo importante de prueba compuesta lo estudió Jacobo Bernoulli y lo 
conocemos por el nombre de sucesión de pruebas de Bernoulli. Se trata de una 
sucesión de pruebas repetidas ejecutadas en las mismas condiciones, siendo cada 
resultado estocásticamente independiente de las demás. Cada prueba tiene exacta- 
mente dos resultados posibles, corrientemente llamados «éxito» y «fallo»; la pro- 
babilidad del éxito se representa por p y la del fallo con q. Naturalmente, 
q = 1 —p. E1 teorema principal relacionado con las sucesiones de Bernoulli es el 
siguiente: 

teorema 13.3. fórmula de bernoulli. Lfl probabilidad de k éxitos en 
n pruebas de Bernoulli es 




donde 


0 


representa el coeficiente binomial, 


©■ 


Demostración. Representemos el «éxito» con S y el «fallo» con F y considere- 
mos una sucesión particular de n resultados. Esto puede representarse mediante 
una n-pla. 


(XlXîì, ... ,x„), 

donde cada xt es S o F. E1 suceso A en el que estamos interesados es la colècción 
de todas las n-plas que contienen exactamente k veces la S y n — k veces la F. 
Calculemos la probabilidad de una n-pla determinada de A. La probabilidad de 
cada S es p, y la de cada F es q. Luego, en virtud de (13.19), la probabilidad de 
cada n-pla de A es el producto de k factores iguales a p por n — k factores q. 
Esto es, 


P(x lt x 2 ,... ,x n ) = p k q n ~ k si (x lt x . ,x n )eA. 


Por lo tanto, para calcular P(A) tan sólo tenemos que contar el número de elemen- 
tos de A y multiplicar dicho número por p^q nk . Pero el número de elementos 
de A es simplemente el número de maneras de colocar k veces la S en las n posi- 
ciones posibles de n-pla. Esto es lo mismo que el número de subconjuntos de k 
elementos que pueden formarse con un conjunto de n elementos; sabemos ya que 
este número es (£). De ahí que, si sumamos las probabilidades correspondientes 
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a todos los puntos de A obtenemos: 


P(A)= 

ejemplo 1. Se lanza 50 veces una moneda. Calcular la probabilidad de que 
salgan 25 caras exactamente. 

Solución. Interpretamos este j'uego como una sucesión de 50 pruebas de 
Bernoulli, en las que «éxito» significa «cara» y «fallo» será «cruz». Supuesta la 
moneda correcta asignamos las probabilidades p = q = y 2 , y la fórmula (13.20) 
nos da (“)(è) 5 ° como probabilidad de obtener exactamente k veces cara en 50 
tiradas. En particular, si k = 25 obtenemos: 



Para expresar este número en forma decimal es mejor utilizar logaritmos, y mane- 
jando tablas de logaritmos de factoriales. Designando el número buscado por P, 
en logaritmos base 10 obtenemos 

log P = log 50! - 2 log 25! - 50 log 2 

= 64.483 - 50.381 - 15.052 = -0.950 = 0.05 - 1.00 
= log 1.12 - loglO = log0.112, 
así que P = 0,112. 

ejemplo 2. i,Cuál es la probabilidad de conseguir r éxitos por lo menos 
en n pruebas de Bernoulli? 

Solución. Sea Au el suceso «obtener exactamente k éxitos en n pruebas». 
E1 suceso E que analizamos es la reunión 

E = A r U A r+1 U • • • U A n . 


Ya que los Ak son disjuntos, encontramos: 
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Puesto que, 

Ỳ{jcj pkq '‘~ k7=(p + q)n=l ’ - 

la probabilidad del suceso complementario E' puede calcularse así: 

P(E') = 1 - P(E) =2(fc) P ^" 

Esta última suma nos da la probabilidad de lograr por lo menos r — 1 éxitos en 
n pruebas. 

13.17 Número más probable de éxitos en n pruebas de Bernoulli 

Un par de dados correctos es lanzado 28 veces. iCuál es el número más pro- 
bable de sietes? Para resolver este problema designemos con f(k) la probabilidad 
de obtener exactamente k sietes en 28 tiradas. La probabilidad de conseguir un 
siete en una tirada es %• La fórmula de Bernoulli nos dice que 


m = 


\6 


Queremos determinar qué valor (o valores) de k entre los valores k = 0, 1,2, 
.... 28 hacen máximo a f(k). E1 siguiente teorema resuelve la cuestión para cual- 
quier sucesión de pruebas de Bernoulli. 

teorema 13.4. Dados un entero n ^ 1 y un número real p, 0 < p < 1, 
consideremos el conjunto de números 


f(k) = (£)/(l ~ P) n k , para k = 0,1. n . 

a) St' (n + 1 )p no es entero, el máximo de f(k) se presenta exactamente 
para un valor de k: 

k = [(« + 1 )p], el mayor entero < (n + 1 )p. 

b) Si (n + 1 )p es entero, el máximo de f(k) se presenta exactamente para 
dos valores de k: 


k = (n + 1 )p 


y k = (n+\)p - 1. 
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Demostración. Para estudiar el comportamiento de j{k) consideremos la 
razón 


r(k) = 


m 

f(k + 1) 


k + 1 1 — p 
n — k p 


para k = 0,1,... ,n — 1. La función r(k) es creciente en sentido estricto por lo 
cual tenemos 


0 < r(0) < r(l) < • • ■ < r(n - 1). 


Vamos a considerar seis casos, representados en la figura 13.2. En los tres prime- 
ros demostramos que j(k) toma su valor máximo para un solo valor de k. En los 
restantes f(k) alcanzan su máximo para dos valores consecutivos de k. 



Caso 1 






Caso 2 Caso 3 




Caso 6 


Figura 13.2 Cálculo del número más probable de éxitos en n pruebas de Bernoulli. 


CASO 1. r(0) > 1. En este caso r(k) > 1 para todo k con lo que 

/(0)>/(l) >■•■>/(«). 

Por consiguiente el valor máximo de f(k) se presenta sólo para k = 0. También, 
r(0) = (1 - p)/(np)> 1, así que 1 - p >np, (n + l)p<l, luego [(n+l)p] = 0. 
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CASO 2. r(n - 1) < 1. En este caso r{k) < 1 para todo k con lo que 
/(0) < /(1) < ... < /(«) y el valor máximo de f(k) se presenta sólo para k = n. 
Puesto que r(« - 1) = n(l - p)/p < 1, tenemos n - np < p, luego n <(n+\)p 
< n + 1, así que [(« + 1 )p] = n. 

CASO 3. r(0) < 1, r(n — 1) > 1, y r(k) * 1 para todo k. En este caso hay 

un unico entero s, 0 < s < n, tal que r(s - 1) < 1 y r(s) > 1. La función f(k) es 
creciente en el intervalo 0 < k < s y decreciente en el intervalo s<k <n. Por 
^onsiguiente f(k) tiene un solo máximo en k = s. Puesto que r(s — 1) = s(l — p)/ 
(np - sp + p) < 1 tenemos s < (n + 1 )p. La desigualdad r(s) > 1 demuestra 
que (n + l)p < s + 1, luego [(« + l)p] = s. 

Obsérvese que en cada uno de los tres primeros casos el valor máximo de 
f(k) se presenta cuando k = [(« + l)p]; asimismo (n + 1 )p no es entero en 
ninguno de esos casos. 

CASO 4. r(0) <1, r(n - 1) > 1, y r(s — 1) = 1 para un cierto s, 
2 < s < n. En este caso f(k) crece para 0 ^ k < s - 1 y decrece para s < k < n. 
E1 valor máximo de f(k) se presenta dos veces, cuando k = s — 1 y cuando k = s. 
La ecuación r(s — 1) = 1 implica (n + l)p = s. 

CASO 5. r(n — 1) = 1. En este caso r(k) < 1 para k ^ n - 2, así que 
f(k) crece en el intervalo 0 ^ k ^ n — 1, y f(n — 1) = /(«). Luego f(k) tiene dos 
máximos, cuando jt = n- ly cuando k = n. La ecuación r(n - 1) = 1 implica 
(n + l)p = n. 

CASO 6. r(0) = 1. En este caso r(k) > 1 para k> 1, así que f(k) decrece 
en el intervalo 1 < fc ^ Los máximos de f(k) son dos, cuando k = 0 y cuando 
k = 1. La ecuación r(0) = 1 implica (n + l)p = 1. 

En cada uno de los tres últimos casos el valor máximo de f(k) ocurre para 
k = (n + l)p y para k = (n + l)p — 1. Esto completa la demostración. 

ejemplo 1. Un par de dados se lanza 28 veces. iCuál es el número más 

probable de sietes? 

Solución. Se aplica el teorema 13.4 con n = 28, p = %> y (n + l)p = ¥ 

Éste no es un entero con lo cual el valor máximo de f(k) se presenta parí 

k= [¥] =4. 

Observación: Si se echan los dados 29 veces hay dos soluciones, k = 4 y k=5 

ejemplo 2. Hallar el menor n tal que si se tiran dos dados correctos i 
veces la probabilidad de conseguir cuatro sietes es por lo menos tan grande comi 
la de obtener cualquier otro número de sietes. 
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Solución. Tomamos p = % en el teorema 13.4. Queremos que el máximo 
de f(k) ocurra cuando k = 4. Esto exige o bien que [(n + l)p]=4, (n+l)p = 4, 
o (n + \)p — 1 = 4. E1 menor valor de n que satisface cualquiera de esas rela- 
ciones es n = 23. 

13.18 Ejercicios 

1. Se lanza una moneda dos veces, la probabilidad de cara en la primera tirada sea pi y 
en la segunda tirada p^. Consideremos esto como una prueba compuesta determinada 
por dos pruebas estocásticamente independientes, y sea el espacio muestral 

S = {(H, H), (H, T), (T, H), (T, T)}. 

a) Calcular la probabilidad de cada elemento de S. 

b) iPuede ser la asignación de las probabilidades pi y p% de modo que 

P(H, H) = l-, P(H, T) = P(T, H) = |, P(T, T) = f? 

c) iPueden ser asignadas pi y pz de modo que 

P(H, H) = P(T, T) = \-, P(H, T) = P(T,H) = ±? 

d) Considerar los cuatro sucesos siguientes (subconjuntos de S); 

H i: cara en la primera tirada, 

Hi\ cara en Ia segunda tirada, 

Tm cruz en la primera tirada, 

T>: cruz en Ia segunda tirada. 

Determinar qué pares de esos cuatro sucesos son independientes. 

En cada uno de Ios ejercicios del 2 al 12 determinar el espacio muestral, la asignación 
de probabilidades, y el suceso cuya probabilidad se calcule. 

2. Un estudiante debe rendir un examen consistente en 10 preguntas. No está preparado 
para ello y se propone acertar las preguntas contestándolas al azar. Por ejemplo, puede 
lanzar una buena moneda y utilizar el resultado para determinar su pronóstico. 

a) Calcular la probabilidad de que acierte correctamente por lo menos cinco veces. 

b) Calcular la probabilidad de que acierte correctamente por lo menos nueve veces. 

c) cCuál es el menor valor de n tal que la probabilidad de acertar por lo menos n 

respuestas correctas es menor que í ? 

3. Diez dados correctos se lanzan juntos. iCuál es la probabilidad de obtener exactamente 
tres seises? 

4. Se lanza cinco veces una moneda correcta. ^Cuál es la probabilidad de obtener a) tres 
caras exactamente, b) por lo menos tres caras, c) por lo menos una cara? 

5. Un hombre afirmaba poseer una varilla con la que podía Iocalizar yacimientos de petró- 
leo. E1 Departamento de Geología de Caltech realizó el siguiente experimento para poner 
a prueba su afirmación. Fue colocado en una habitación donde había 10 barriles precin- 
tados. Se Ie advirtió que cinco de ellos contenían petróleo y los otros cinco agua. 
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Su trabajo consistió en decidir cuáles contenían petróleo y cuáles agua. 

a) iCuál es la probabilidad de que localizara correctamente los cinco barriles de pe- 
tróleo tan sólo por azar? 

b) iCuál la de que localizara por lo menos tres de los barriles de petróleo únicamente 
por azar? 

6. Una anciana de Pasadena afirma que probando una taza de té con leche puede decir 
qué fue lo primero que se puso en la taza: el té o la leche. Tal afirmación se pone a 
prueba haciéndole degustar y clasificar 10 pares de tazas de té, conteniendo cada par 
una taza de té servida de cada una de las dos maneras citadas. Sea p su probabilidad 
«cierta» de clasificar un par de tazas correctamente. (Si ella es hábil, p es substancial- 
mente mayor que |; si no lo es, p<\.) Se supone que los 10 pares de tazas son clasi- 
ficadas bajo condiciones idénticas e independientes. 

a) Calcular, en función de p, la probabilidad de que clasifique correctamente por lo 
menos ocho de los 10 pares de tazas. 

b) Valorar esta probabilidad explícitamente cuando p = l • 

7. (Otro problema del caballero de Méré.) Determinar si es o no ventajoso jugar apos- 
tando cantidades iguales, a que por lo menos aparece un 6 en cuatro tiradas de un 
dado correcto. [Indicación. Probar que la probabilidad de sacar por lo menos un 6 en 
n tiradas es 1 — (§■)".] 

8. Una urna contiene a bolas blancas y b bolas negras. Si k < n, calcular la probabilidad 
de sacar k bolas blancas en n extracciones, si cada bola es devuelta a la urna antes de 
sacar la siguiente. 

9. Se lanzan dos dados ocho veces. Calcular la probabilidad de que la suma sea 11 exacta- 
mente tres veces. 

10. Se lanza una moneda 10 veces o 10 monedas una vez y se cuenta el número de caras. 
Encontrar la probabilidad de obtener por lo menos seis caras. 

11. Después de una larga serie de tests aplicados a cierto tipo de cohete se ha determinado 
que aproximadamente en un 5 % de pruebas se producirá un mal funcionamiento que 
será la causa de que el cohete fracase. Calcular la probabilidad de que en 10 pruebas 
haya por lo menos un fallo. 

12. Se lanza repetidamente una moneda. Calcular la probabilidad de que el número total 
de caras sea por lo menos 6 antes de que el número total de cruces sea 5. 

13. E1 ejercicio 12 puede generalizarse como sigue: Demostrar que la probabilidad de que 
se produzcan por lo menos m éxitos antes que n fallos en una sucesión de pruebas de 
Bernoulli es: 


'I' 


k 


14. Determinar todos los valores de n con la siguiente propiedad: Si se tira n veces un par 
de dados correctos, la probabilidad de obtener exactamente diez sietes es por lo menos 
tan grande como la de obtener cualquier otro número de sietes. 

15. Una máquina tragamonedas binaria tiene tres ruedas idénticas e independientes. Cuando 
se juega con la máquina los resultados que pueden obtenerse son ternas ordenadas 
(x, y, 2 ), en donde cada una de las letras x, y, z puede ser 0 ó 1. En cada rueda la 
probabilidad de 0 es p y la probabilidad de 1 es 1 — p, en donde 0< p < 1. La máquina 
paga 2$ si el resultado es (1,1,1) o (0,0,0); paga 1$ si se obtiene el resultado (1,1,0); 
en cualquier otro caso no paga nada. Designemos con /(p) la probabilidad de que la 
máquina pague un dólar o más cuando se haga una tirada. 

a) Calcular /(p). 
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b) Defmamos el «pago total» como la suma Xr< v g(x)P(x), en donde S es el espacio 
muestral, P(x) es la probabilidad del resultado x, y g(x) el númcro de dólares pagados 
por el resultado x. Calcular el valor de p para el cual el «pago total» sea mínimo. 

13.19 Conjuntos numerables y no numerables 

Hasta aquí sólo hemos considerado el concepto de probabilidad para espa- 
cios muestrales finitos. Queremos ahora extender la teoría a espacios muestrales 
infinitos. Para ello es necesario distinguir dos tipos de conjuntos infinitos, los 
numerables y los no numerables. En esta sección se estudian ambos. 

Para contar los elementos de un conjunto finito se pone en corresponden- 
cia el conjunto, elemento a elemento, con el conjunto de los números naturales 
{1, 2,...,«}. La comparación de los «tamanos» de dos conjuntos mediante la 
correspondencia entre ellos elemento a elemento sustituye el recuento de los ele- 
mentos cuando se trata de conjuntos infinitos. A este proceso se le puede dar una 
clara formulación matemática empleando el concepto de función: 

definición Se dice que dos conjuntos A y B están en correspondencia uno 
a uno si existe una función f con las propiedades siguientes: 

a) El dominio de f es A y el recorrido de f es B. 

b) Si x e y son elementos distintos de A, entonces f(x) y f(y) son elementos 
distintos de B. Esto es, para todo par de elementos x e y de A, 

U L21) x J 4 r implica f(x) ^ J'( v). 

Una función que satisfaga la propiedad (13.21) se llama uno a uno sobre A. 
Dos conjuntos A y B en correspondencia uno a uno se llaman también equivalen- 
tes, e indicamos esto poniendo A ~ B. Resulta claro que todo conjunto A es equi- 
valente a sí mismo, puesto que f(x) = x para cada x de A. 

Un conjunto puede ser equivalente a un subconjunto de sí mismo. Por ejemplo 
el conjunto P={ 1,2,3...}, compuesto por todos los números enteros positivos, 
es equivalente a su subconjunto Q = {2,4,6...} compuesto por los pares positi- 
vos. En este caso, la función uno a uno que los hace equivalentes es f(x) = 2x 
para todo x de P. 

Si A ~ B es fácil de demostrar que B ~ A. Si / es uno a uno en A y si el 
recorrido de / es B, entonces para cada b en B existe excatamenet un a en A tal 
que f(a) = b. De ahí que podemos definir una función inversa g en B del modo 
siguiente: Si b e B, g(b) = a, donde a es el único elemento de A tal que f(a) = b. 
Esta g es uno a uno en B y su recorrido es A; luego B ~ A. Esta propiedad de 
equivalencia se llama simetría. 


(13.22) 


A ~ B implica B ~ A. 
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También es fácil demostrar que la equivalencia tiene la propiedad siguiente, lla- 
mada transitividad: 

(13.23) A~B y B~C implica A~C. 

En el ejercicio 2 de la sección (13.20) se propone una demostración de la propie- 
dad transitiva. 

Un conjunto S se denomina finito y se dice que contiene n elementos si 
5~{l,2,...,n}. 

E1 conjunto vacío también se considera finito. A los conjuntos que no son finitos 
se les llama infinitos. Un conjunto S se llama infinito numerable si es equivalente 
al conjunto de todos los números naturales, esto es, si 

(13.24) S~{1,2,3,...}. 

En este caso existe una función f que establece una correspondencia uno a uno 
entre los enteros positivos y los elementos de S; luego el conjunto S puede expre- 
sarse según la notación en lista así: 

S = {/(l),/(2),/(3),...}. 

A menudo utilizamos subíndices y representamos f(k) con ak (o con una notación 

parecida) y escribimos S = {a„ a 2 , a 3 .}. La idea importante es aquí que la 

correspondencia (13.24) nos permite usar los métodos naturales como «marcas» 
de los elementos de S. 

Un conjunto se dice que es numerable en sentido amplio si es finito o infinito 
numerable. Un conjunto que no es numerable se llama no numerable. (Se darán 
ejemplos.) Muchas operaciones con conjuntos efectuadas sobre conjuntos nume- 
rables producen conjuntos numerables. Por ejemplo, tenemos las propiedades si- 
guientes: 

a) Todo subconjunto de un conjunto numerable es numerable. 

b) - La intersección de toda colección de conjuntos numerables es numerable. 

c) - La rçunión de una colección numerable de conjuntos numerables es nu- 
merable. 

d) E1 producto cartesiano de un número finito de conjuntos numerables es 
numerable. 

Puesto que en este libro trataremos muy poco de los conjuntos infinitos nu- 
merables, no daremos con detalle las demostraciones de sus propiedades.(*) En 
cambio, ofrecemos varios ejemplos para poner de manifiesto cómo con ellas se 
pueden construir nuevos conjuntos numerables a partir de unos dados. 


(*) En los ejercicios 3 al 8 de la sección 13.20 se esbozan las demostraciones. 
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ejemplo 1. E1 conjunto S de todos los números enteros (positivos, negativos 
y el cero) es numerable. 

Demostración. Si n e S, sea f(n) = 2n si n es positivo, y f(n) = 2'nj + 1 
si n es negativo o cero. E1 dominio de / es S y su recorrido es el conjunto de ente- 
ros positivos. Puesto que f es uno a uno en S, se deduce que S es numerable. 

ejemplo 2. E1 conjunto R de todos los números racionales es numerable. 

Demostración. Para cada entero n > 1 fijo, sea S„ el conjunto de números 
racionales de la forma x/n, donde x pertenece al conjunto S del ejemplo 1. Cada 
S„ es equivalente a S [tómese /(í) = nt si t e S„] y por consiguiente cada S„ es 
numerable. Puesto que R es la reunión de todos los S„, en virtud de la propie- 
dad c) resulta R numerable. 

Observación. Si & = {Ai.A?, A 3 ,... } es una colección numerable de conjuntos, 
la reunión de todos ellos se expresa con el símbolo 

jj A k o A t u A z u A 3 U • • •. 

ejemplo 3. Sea A = {a u a 2 , a 3 ,..., } un conjunto infinito numerable. 
Para cada entero » > 1, sea la familia de subconjuntos de A con n elemen- 
tos. Esto es: 


^, = {S|SsAyS tiene n elementos}. 

Vamos a probar que cada es numerable. 

Demostración. Si S es un subconjunto de n elementos de A, podemos es- 
cribir: 


S={a ki ,a ki ,...,a K }, 

donde k 3 < k 2 < ... < k„. Sea /(S) = (%, a^,... , a k J. Esto es, / es la fun- 
ción que asocia a S la tz-pla ordenada (a ki , a k ,... , a k ). E1 dominio de / es 3F n y 
su recorrido, que designamos con T„, es un subconjunto del producto cartesiano 
C„ = AxAX...XA(n factores). Ya que A es numerable, lo mismo le ocurre 
a C„ [por la propiedad d)] y, por lo tanto, T„ también lo es [por la propiedad 
a) ]. Pero T n ~ ,W n puesto que / es uno a uno. Esto demuestra que .'F n es nu- 
merable. 

ejemplo 4. La colección de todos los subconjuntos finitos de un conjunto 
numerable es numerable. 


Demostración. E1 resultado es evidente si el conjunto dado es finito. Supon- 
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gamos, pues, que el conjunto dado (llamémosle A) es infinito numerable, y repre- 
sentemos conJHa clase de todos los subconjuntos finitos de A: 

= { 5 | 5 £/lySes finito} 

En estas condiciones es la reunión de todas las familias !F n del ejemplo 3; 
luego, en virtud de la propiedad c), J^es numerable. 

ejemplo 5. La colección de todos los subconjuntos de un conjunto infinito 
numerable es no numerable. 

Demostración. Sea A el conjunto numerabíe dado y s/ la familia de todos 
los subconjuntos de A. Supondremos que s/ es numerable y llegaremos a una con- 
tradicción. Si s/ es numerable, entonces s/ ~ A y por tanto existe una función / 
uno a uno cuyo dominio es A y cuyo recorrido es s/. Así, para cada a de A, el 
valor f(a) de la función es un subconjunto de A. Este subconjunto puede o no 
contener el elemento a. Designemos con B el conjunto de elementos a tales que 
a <£ f(a). Así 


B = {a | a e A peroa $f(a)}. 

Siendo B un subconjunto de A, debe pertenecer a la familia s/. Esto signi- 
fica que B = f(b) para algún b de A. Existen ahora dos posibilidades: i )beB, o 
ii) b $ B. Si b e B, según la definición de B tenemos b <ff(b), que es una contra- 
dicción, ya que f(b) = B. Por tanto i) es imposible. En el caso n), b $ B, o sea, 
b $f(b). Esto contradice la defmición de B, con lo que ii) también es imposible. 
Por consiguiente, el suponer que s/ es numerable nos lleva a una contradicción y 
debemos concluir que s/ es no numerable. 

A continuación ofrecemos un ejemplo de conjunto no numerable más sencillo 
que el del ejemplo 5. 

ejemplo 6. E1 conjunto de números reales x que satisfacen 0 < x < 1 es 
no numerable. 

Demostración. Supongamos otra vez que el conjunto es numerable y llega- 
remos a una contradicción. Si el conjunto es numerabl'e podemos disponer sus 
elementos así: {x lt x 2 , x 3 ,... }. Construiremos ahora un número real y que cum- 
pla 0 < y < 1 y que no estará en la lista. A tal fin escribimos cada elemento x„ 
en forma decimal: 
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donde cada a„,i es uno de los enteros del conjunto {0, 1, 2,..., 9}. Sea y el nú- 
mero real cuyo desarrollo decimal es: 


y = 0. yi y 2 y a .... 

si a n _ n 5-í 1, 
si a n _ n = 1. 

De este modo ningún elemento del conjunto {x t , x 2 , x 3 ,... } puede ser igual a y, 
puesto que y difiere de x ( en la primera cifra decimal, de x 2 en la segunda, y en 
general, difiere de x* en la k-é sima cifra decimal. Por tanto y satisface 0 < y < 1, 
lo cual es una contradicción, lo que prueba que el conjunto de números reales del 
intervalo abierto (0,1) es no numerable. 

13.20 Ejercicios 



1. Sea P = { 1,2,3,...} el conjunto de los números naturales. Para cada uno de los si- 
guientes conjuntos, dar una función uno a uno / cuyo dominio es P y cuyo recorrido 
es el conjunto en cuestión: 

a) A = {2,4, 6,...}, conjunto de los números pares positivos. 

b) B = {3,3 2 ,3 3 4 5 ,...}, conjunto de las potencias de 3. 

c) C = {2,3,5,7,11,13,...}, conjunto de los números primos. [ Nota . Una parte de 
la demostración consiste en demostrar que C es un conjunto infinito.] 

d) P X P, producto cartesiano de P por sí mismo. 

e) E1 conjunto de enteros de la forma 2“3", donde m y n son naturales. 

2. Demostrar la propiedad transitiva de la equivalencia de conjuntos 

Si A ~ B y B ~ C, entonces A ~ C. 

[Indicación. Si / hace A equivalente a B y g hace B equivalente a C, demos- 
trar que la función compuesta h = g°f hace A equivalente a C.] 

Los ejercicios del 3 al .8 están dedicados a las demostraciones de las propiedades a), b), 
c), d) de los conjuntos numÉrables citadas en la sección 13.19. 

3. Demostrar que todo subconjunto de un conjunto numerable es numerable. [Indicación. 
Supóngase S un conjunto infinito numerable, sea S = [xr,X 2 ,xa,...}, y sea A un sub- 
conjunto infinito de S. Sea k(l) el menor número natural m tal que x m e A. Admi- 
tamos que k(ì), k(2 ),.... k(n — 1) estén definidos, sea k(n) el menor número natural 
m > k(n — 1) tal que x m E A. Sea f(n) = Demostrar que / es una función uno a 
uno cuyo dominio es el conjunto de los números naturales y cuyo rango es A. Esto 
demuestra el teorema en el supuesto de que S sea infinito numerable. Construir otra de- 
mostración para S finito.] 

4. Demostrar que la intersección de cualquier colección de conjuntos numerables es nu- 
merable. [Indicación. Utilizar el resultado del ejercicio 3.] 

5. Sea P = { 1,2,3,...} el conjunto de los números naturales. 

a) Demostrar que el producto cartesiano P X P es numerable. [Indicación. Desígnese 
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con Q el conjunto de números naturales de la forma 2”3", donde m y n son naturales. 
Entonces Q c P, de modo que Q es numerable (en virtud del ejercicio 3). Si 
(m, n) e P x P, tómese /(m, n) = 2”3* y utilizar esta función para demostrar que 
PxP ~ Q.] 

b) Deducir de a) que el producto cartesiano de dos conjuntos numerables es numera- 
bíe. Utilizar el método de inducción y extender el resultado a n conjuntos numerables. 

6. Sea = {Bì,B 2 ,Bs, ...} una colección numerable de conjuntos disjuntos (B. nB, = 0 

si i 5-í j) tal que cada B„ es numerable. Demostrar que la reunión (J B k es también 

numerable. [Indicación. Sea B n = {é ln , 6 2 ,n> b 3n ,. . .}y S= (JBj.. Si x 6 S, en- 

tonces x = b„. n para algún único par ( m,n) y podemos definir f(x) = (m, n). Utilizar 
esta / para demostrar que S es equivalente a un subconjunto de P X P y deducir (en 
virtud del ejercicio 5) que S es numerable.] 

7. Sea sé = {A\, As.As ,...} una colección numerable de conjuntos, y definamos 
âS={Bi,B 2 ,B3,...} así: Bi = Ai y.para n > 1, 

B n = A„ - 0 A k . 

fc=i 


Esto es, B n consta de los elementos de A„ que no pertenecen a los conjuntos preceden- 
tes Ai,Az,... An-i. 

Demostrar que âtf es una colección de conjuntos disjuntos (B, n B, = 0 si i ?■* /) y que 


ÍM-ÛV 

fc=l k=l 

Esto nos permite expresar la reunión de cualquier colección numerable de conjuntos 
como reunión de una colección numerable de conjuntos disjuntos. 

8. Si es una colección numerable de conjuntos numerables, demostrar que la reunión 
de todos los conjuntos de & es numerable. [Indicación. Utilizar los ejercicios 6 y 7.] 

9. Demostrar que los siguientes conjuntos son numerables: 

a) E1 conjunto de todos los intervalos del eje real con extremos racionales. 

b) E1 conjunto de todos los círculos del plano con radios racionales y centros de 
coordenadas racionales. 

c) Cualquier conjunto de intervalos disjuntos de longitud positiva. 

10. Demostrar que los siguientes conjuntos son no numerables: 

a) E1 conjunto de los números irracionales del intervalo (0,1). 

b) E1 conjunto de todos los intervalos de longitud positiva. 

c) E1 conjunto de todas las sucesiones cuyos términos son los enteros 0 y 1. (Recuér- 
dese que una sucesión es una función cuyo dominio es el conjunto de los números 
naturales.) 


13.21. Definición de probabilidad para espacios muestrales infinitos numerables 

En esta sección se extiende la definición de probabilidad a espacios muestra- 
les infinitos numerables. Sean S un conjunto infinito numerable y J un álgebra 
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de Boole de subconjuntos de S. Definamos una medida de probabilidad P en f 
como se hizo en el caso finito, excepto que exigiremos la aditividad numerable 
además de la aditividad finita. Esto es, para toda colección infinita numerable 
{A lt A 2 ,... } de elementos de 38, exigimos que 


(13.25) =2,P(A k ) si Af n A } = 0 siempre que i ¥=j. 

Las funciones de conjunto de aditividad finita que satisfacen (13.25) se llaman de 
aditividad numerable (o completamente aditivas). Naturalmente, esta propiedad 
exige también suponer que la reunión numerable A^ U A 2 U A 3 U • ■ • pertenece 
a 38 cuando cada A k pertenezca a 38. No todas las álgebras de Boole tienen esta 
propiedad. Las que la tienen se llaman <r-álgebras de Boole. Un ejemplo es el 
álgebra booleana de todos los subconjuntos de S. 

DEFINICIÓN DE PROBABILIDAD PARA ESPACIOS MUESTRALES INFINITOS NUME- 

rales. Sea á? una c-álgebra de Boole cuyos elementos son subconjuntos de un 
conjunto infinito numerable S dado. Una función de conjunto P se llama medida 
de probabilidad en 38 si es no negativa, de aditividad numerable y satisface 
P(.S) =1. 

Cuando 38 es el álgebra de Boole de todos los subconjuntos de S, una fun- 
ción de probabilidad queda completamente determinada mediante sus valores para 
los subconjuntos de un solo elemento (tales valores se llaman probabilidades pun- 
tuales). Todo subconjunto A de S es finito o infinito numerable, y la probabilidad 
de A se calcula sumando las probabilidades puntuales para todos los elementos 
de A, 


P(A) = !/(*)• 

La suma del segundo miembro tiene un número finito de sumandos o es una serie 
absolutamente convergente. 

E1 ejemplo que sigue muestra un ejemplo de una prueba con un espacio mues- 
tral infinito numerable. 

ejemplo. Se lanza una moneda repetidamente hasta que el primer resul- 
tado vuelve a aparecer por segunda vez; entonces termina el juego. 

Como espacio muestral tomamos la colección de todos los posibles juegos que 
pueden hacerse. Este conjunto puede expresarse como la reunión de dos conjuntos 
infinitos numerables A y B que son 

A = {TT, THT, THHT, THHHT, . . .} y B = {HH, HTH, HTTH, HTTTH, . . .}. 
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Designamos los elementos del conjunto A (en el orden en que se citan en la lista) 
con a 0 , a u a 2 ,..., y los de B con b 0 , b u b 2 ,... . Podemos asignar arbitraria- 
mente probabilidades puntuales no negativas P(a„) y P(b„) con tal que 

ÏP(a n ) + ì Q P (b n ) = 1. 

Por ejemplo, supongamos que la moneda tenga probabilidad p de mostrar 
cara (H) y probabilidad q = 1 — p de mostrar cruz ( T ), siendo 0 < p < 1. En- 
tonces sería natural la asignación de probabilidades puntuales 

(13.26) P(a n ) = q 2 p n y P(b n ) = p 2 q n . 

Tal asignación-es aceptable porque tenemos 

Jp(a n ) + ^P(b n ) = q^p n + p 2 ^q n = -í— + -S— = q + p = 1. 
n^O n?0 n^O n^O 1 ~ P 1 ~ « 

Supongamos ahora que queremos saber la probabilidad de que el juego ter- 
mine después de exactamente n + 2 lanzamientos. Éste es el suceso {a„} u {b n }, 
y su probabilidad es 

P(a n ) + P(b n ) = q 2 p n + p 2 q n . 

La probabilidad de que termine el juego por lo menos en n + 2 lanzamien- 
tos es 

% p ( a k) +Ỳfi b k) = —— + P 2 —— = 1 - qp n+1 ~ pq n+1 • 

t?o t^o i - p i - q 


13.22 Ejercicios 

Los ejercicios de esta sección se refieren al ejemplo de la sección 13.21. 

1. Utilicemos las probabilidades asignadas en la ecuación (13.26), designemos con /„(p) la 
probabilidad de que el juego finalice exactamente en n + 2 tiradas. Calcular los valores 
máximo y mínimo absolutos de /„(p) en el intervalo 0 < p < 1 para cada uno de los 
valores n = 0, 1, 2, 3. 

2. Demostrar que es aceptable cada una de las asignaciones de probabilidades puntuales 
siguientes. 

a) P(a n ) = P(b n ) = ^ para n = 0,1,2, _ 
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b) P(a n ) = P(b n ) = 


(n + 2 )(n + 3) 


para n = 0, 1, 2,... . 


3. Calcular la probabilidad de que termine el juego antes de la quinta tirada, utilizando: 

a) las probabilidades puntuales de (13.26). 

b) las probabilidades puntuales del ejercicio 2 a). 

c) las probabilidades puntuales del ejercicio 2 b). 

4. Calcular' la probabilidad de que se necesite un número impar de tiradas para terminar 
el juego, utilizando: 

a) las probabilidades puntuales de (13.26). 

b) las probabilidades puntuales del ejercicio 2 a). 

c) las probabilidades puntuales del ejercicio 2 b). 


13.23 Ejercicios variados sobre probabilidades 

1. iCuál es la probabilidad de conseguir un siete con dos d dos correctos? 

2. Diez senores y sus esposas están sentados al azar en un banquete. Calcular la probabili- 
dad de que un determinado seiíor esté sentado junto a su esposa si: a) están sentados 
en una mesa circular; b) están sentados en fila. 

3. Un armario tiene dos cajones. E1 cajón número 1 contiene cuatro monedas de oro y dos 
de plata. E1 cajón número 2 contiene tres monedas de oro y tres de plata. Se abre un 
cajón al azar y de él se extrae una moneda al azar. Calcular la probabilidad de cada 
uno de los siguientes sucesos: 

a) Que sea abierto el cajón número 2 y se saque una moneda de plata. 

b) Que sea extraída una moneda de oro del cajón abierto. 

4. Dos cartas se escogen sucesivamente en una baraja de 52 cartas, teniendo cada carta la 
misma probabilidad de ser elegida. 

a) iCuál es la probabilidad de que por lo menos una sea una espada? 

Sin examinar las dos cartas escogidas se echan en una bolsa. Se extrae de la bolsa 
una de las cartas y se examina viéndose que no es una espada. (Cada carta tiene la 
misma probabilidad de ser extraída.) 

b) iCuál es ahora la probabilidad de tener por lo menos una espada? 

La carta antes extraída de la bolsa se devuelve a la misma y las dos cartas se bara- 
jan. Nuevamente se extrae una carta y se examina. No hacemos comparación alguna 
para ver si la carta es la misma que antes se extrajo. Otra vez se devuelve la carta 
a la bolsa y se barajan. Esta operación se hace tres veces, incluyendo la de la parte b), 
y cada vez la carta examinada no es espada. 

c) tCuál es el espacio muestral y la función de probabilidad de este experimento? 
iCuál es la probabilidad de que una de las dos cartas originales sea espada? 

5. Un hombre tiene diez monedas de un centavo, 9 corrientes y 1 con dos caras. Toma 
una moneda al azar y la lanza seis veces, y siempre obtiene cara. Calcular la probabi- 
lidad de que haya tomado la moneda de dos caras. 

6. Demostrar que es imposible «lastrar» un par de dados de modo que todo resultado 
comprendido entre 2 y 12 tenga la misma probabilidad de presentarse. 

7. Un estudiante de segundo aiio de Caltech tiene un despertador que sonará a las hora 
fijada con probabilidad 0,7. Si suena, le despertará a tiempo para llegar a su clase de 
matemáticas con probabilidad 0,8. Si no suena, la probabilidad de que llegue a su 
clase es 0,3. Calcular la probabilidad de que llegue a tiempo a clase. 

8. Tres caballos A, B, y C están en una carrera. E1 suceso «A vence a B» se designará 
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simbólicamente escribiendo AB. E1 suceso «A vence a B el cual vence a C» se desig- 
nará por ABC, etc. Se sabe que 


P(AB) = §, P(AC) = f, P(BC) = i, 

y que 

P(ABC) = P(ACB), P(BAC) = />(flC>l), />(C4fi) = />(CA4). 

a) Calcular la probabilidad de que venza A. 

b) Calcular la probabilidad de que venza B. 

c) Calcular la probabilidad de que venza C. 

d) iSon independientes los sucesos AB, AC y CB? 

9. La fase final de un largo cálculo exige la adición de tres enteros 01 , 02 , 03 . Se supone 
que: a) los cálculos de ai, 02 y 03 son estocásticamente independientes; b) en el cálculo 
de cada a, existe una misma probabilidad p de que sea correcto y la probabilidad de 
cometer un error igual a +1 es la misma que la de cometerlo igual a —1; c) no puede 
cometerse error mayor que +1 o menor que —1. Recordar la posibilidad de compen- 
sación de errores, y calcular la probabilidad de que la suma a\ + «2 4- «3 sea correcta 

10. El juego de «sale el non». Se supone que n personas lanzan cada una una moneda de 
manera simulíánea e independiente, donde n > 3; y p es la probabilidad de obtener 
cara con cada una de las monedas. Calcular la probabilidad de que en una tirada dada 
se presente un «non»—, es decir, una persona cuya moneda muestra un resultado 
distinto del de todas las demás. 

11. Se supone que n personas juegan a «sale el non» con monedas correctas (como se ha 
descrito en el ejercicio 10). Para un entero m, calcular la probabilidad de que son 
necesarias precisamente m tiradas para que haya un «non». 

12. Supongamos que una experiencia compuesta (S, 3S, / > )está determinada por dos pruebas 
estocásticamente independientes(5 t , SS\,P 1) y(S 2 , 38 2 , P 2 ) donde S = S\ X S 2 y 

P(x,y) = P\(x)P 2 (y) 

para cada (x, y) de S. E1 objeto de este ejercicio es establecer la fórmula 


(13.27) P(U x V) = P\(U)P 2 (V) 

para todo par de subconjuntos U de 38 x y V d e38 2 . Los espacios muestrales Si y S2 se 
suponen finitos o infmitos numerables. 

a) Comprobar que la igualdad (13.27) es verdadera cuando U y V son conjuntos de un 
solo elemento, y también cuando por lo menos uno de ellos es vacío. 

Supongamos ahora que 

£/ = {«!, U . ,u k } y V = {v x ,v 2 . v m }. 

En tal caso U X V consta de km pares (u., vj). Para cada i = 1,2,... ,k sea Ai el 
conjunto de m pares de U X V cuyo primer componente es u t . 

b) Demostrar que los A, son conjuntos disjuntos cuya reunión es U X V. 

c) Demostrar que 


P(A t ) = ỲP( Ui , V] ) =P x ( Ui )P 2 (V). 
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d) Deducir a partir de b) y c) que 


P(U x V)-ỲP{AÙ = Pi(U)P 2 (V). 
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CÁLCULO DE PROBABILIDADES 


14.1 Definición de probabilidad para espacios muestrales no numerables 

Un segmento rectilíneo se descompone en dos partes, con el punto de sub- 
división elegido al azar. iCuál es la probabilidad de que los dos fragmentos tengan 
la misma longitud? iCuál es la probabilidad de que el mayor tenga exactamente 
longitud doble que la del pequeno? ^Cuál es la probabilidad de que el mayor ten- 
ga longitud por lo menos doble que el menor? Éstos son ejemplos de problemas 
de probabilidad en los que el espacio muestral es no numerable ya que consta de 
todos los puntos del segmento. En esta sección se extiende la definición de proba- 
bilidad incluyendo los espacios muestrales no numerables. 

Si siguiéramos el mismo proceso que para espacios muestrales numerables 
tendríamos que partir de un conjunto no numerable S cualquiera y una a-álgebra 
de Boole 28 de subconjuntos de S' y definir una medida de probabiljdad que fuera 
una función de conjunto P no negativa completamente aditiva definida sobre 28 
siendo P(S) — 1. Esto origina ciertas dificultades técnicas que no se presentan 
cuando S es numerable. Pretender la descripción de esas dificultades nos llevaría 
demasiado lejos. Las evitaremos imponiendo restricciones iniciales al conjunto S 
y al álgebra de Boole 28. 

Primeramente, restringimos S a ser un subconjunto del eje real R, o del 
n-espacio R". Para el álgebra booleana 28 empleamos subconjuntos especiales de 
S que, en el lenguaje de la moderna teoría de la integración, se llaman subcon- 
juntos de S medibles. No intentaremos describir el significado preciso de un con- 
junto medible; en cambio, mencionaremos algunas de las propiedades que posee 
la clase de los conjuntos medibles. 

Consideremos primero subconjuntos de R. Los subconjuntos medibles tienen 
las prooiedades siguientes: 

1) Sî A es medible, asimismo lo es R — A, complemento de A. 
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2) Si {A u A 2 , A 3 ,... } es una colección numerable de conjuntos medi- 
bles, la reunión A x u A 2 U A 3 u ... también es medible. 

3) Todo intervalo (abierto, cerrado, semiabierto, finito o infinito) es medible. 

Así pues, los conjuntos medibles de R forman una «r-álgebra booleana que 
contiene los intervalos. Existe una <r-álgebra booleana mínima (en el sentido de Ia 
inclusión) que tiene esta propiedad; sus elementos se llaman conjuntos de Borel 
en atención al matemático francés Émile Borel (1871-1956). Análogamente, en E 2 
existe un <r-á lgebra booleana mínima que contiene todos los productos cartesianos 
de pares de intervalos; sus elementos son conjuntos de Borel. Los conjuntos de 
Borel en E„ se definen en forma análoga. 

De ahora en adelante, siempre que utilicemos un conjunto S de números rea- 
les como espacio muestral, o, más general, siempre que se use un conjunto S de 
E n como espacio muestral, supondremos que este conjunto es un conjunto de Borel. 
Los subconjuntos de Borel de S forman asimismo una <r-álgebra de Boole; supon- 
dremos que nuestras medidas de probabilidad están definidas sobre esas álgebras 
de Boole. Dichas álgebras son lo bastante amplias para incluir todos los sucesos 
que se presentan en las aplicaciones corrientes de la teoría de probabilidades. 

DEFINICIÓN DE PROBABILIDAD PARA ESPACIOS MUESTRALES NO NUMERABLES. 

Sean S un subconjunto de R n , y âS la <r-álgebra de Boole de subconjuntos de Boreí 
de S. Una función de conjunto no negativa, completamente aditiva P definida en 
í0 con P(S) = 1 se llama medida de probabilidad. La terna ( S, 30, P) se llama 
espacio de probabilidad. 

14.2 Numerabilidad del conjunto de puntos con probabilidad positiva 

Para espacios muestrales numerables la probabilidad de un suceso A se cal- 
cula a menudo sumando las probabilidades puntuales P(x) para todo x de A. Este 
método es aplicable para espacios muestrales no numerables porque, como el si- 
guiente teorema pone de manifiesto, la mayor parte de las probabilidades pun- 
tuales son nulas. 

teorema 14.1. Si (S,3S,P) es un espacio de probabílidad y si T es el 
conjunto de todos los x de S para los que P(x)> 0, entonces T es numerable. 

Demostración. Para cada n = 1, 2, 3,..., designemos con T„ el siguiente 
subconjunto de S: 

Si P(x) > 0 entonces x e T„ para un cierto n. Recíprocamente, si x e T„ para un 
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cierto n entonces x e T. Luego T = T x U T 2 U • • • . Ahora bien T n contiene a 
lo sumo n puntos, pues si contuviera n + 1 puntos o más la suma de sus proba- 
bilidades puntuales excedería a 1. Por lo tanto T es numerable, puesto que es una 
reunión de conjuntos finitos. 

E1 teorema 14.1 nos dice que pueden asignarse probabilidades positivas a lo 
sumo a un subconjunto numerable de S. Los restantes puntos de S tendrán proba- 
bilidad cero. En particular, si todos los resultados de S son igualmente probables, 
entonces todo punto de S debe tener asignada probabilidad cero. 

Observación: Puede darse una interpretación física del teorema 14.1 en fun- 
ción de la distribución de masa que ayuda a comprender su significado. Imagine- 
mos que disponemos de una cantidad de masa que totaliza 1. (Esto corresponde 
a P(S) = 1.) Supongamos que nos es posible distribuir esa masa del modo que 
queramos a lo largo del eje real, bien con espesor uniforme o variable, o bien 
colocando porciones discretas de masa en ciertos puntos, o de ambas maneras. 
(Interpretamos una cantidad positiva de masa como una porción discreta.) Podemos 
colocar toda la masa en un punto. Podemos dividir la masa en porciones discretas 
iguales o desiguales entre dos puntos, diez puntos, un millón de puntos, o entre 
un conjunto no numerable de puntos. Por ejemplo, podemos poner \ en 1, \ en 2, 
J en 3, etcétera, poner masa (£)" en cada entero n> 1. O podemos esparcir la 
masa sin ninguna porción concentrada. O podemos esparcir parte de ella y distri- 
buir el resto en porciones discretas. E1 teorema 14.1 nos dice que a lo más po- 
demos asignar cantidades discretas de masa a un conjunto numerable de puntos. 

Puesto que la mayor parte de (si no todas) las probabilidades puntuales para 
un espacio muestral no numerable será cero, no basta conocer las probabilidades 
puntuales para calcular las probabilidades de sucesos arbitrarios. Se necesita más 
información; la descripción es mejor utilizando dos conceptos nuevos, las varia- 
bles aleatorias y las funciones de distribución, a las que nos vamos a referir segui- 
damente. Dichos conceptos permiten hacer uso del Cálculo integral en muchos 
problemas con espacios muestrales no numerables. La integración sustituye a la 
sumación en el Cálculo de probabilidades. 

14.3 Variables aleatorias 

En muchos experimentos nos interesan números asociados a los resultados del 
experimento. Por ejemplo, n monedas se lanzan simultáneamente y preguntamos 
por el número de caras. Un par de dados ruedan y nos interesa la suma de los 
puntos conseguidos. Se lanza una flecha hacia un blanco circular y queremos saber 
la distancia desde el punto en que cayó, al centro. Siempre que asociamos un 
número real a cada resultado de un experimento estamos tratando con una fun- 
ción cuyo dominio es el conjunto de resultados posibles y cuyo recorrido es el 
conjunto de los números reales en cuestión. Una tal función se llama variable 
aleatoria. A continuación damos una definición formal de variable aleatoria: 
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definición de variable aleatoria. Sea S un espacio muestral. Una jun- 
ción real dejinida en S se llama variable aleatoria unidimensional. Si los valores 
de la junción son pares ordenados de números reales (esto es, vectores en E 2 ), la 
junción es una variable aleatoria bidimensional. Más general, una variable alea- 
toria n-dimensional es simplemente una función cuyo dominio es el espacio mues- 
tral dado S y cuyo recorrido es un colección de n-plas de números reales (vectores 
en E„). 


Así pues, una variable aleatoria no es más que una función vectorial definida 
en un conjunto. La palabra «aleatoria» tan sólo se usa para recordar que el con- 
junto en cuestión es un espacio muestral (*). 

A causa de la generalidad de la anterior definición es posible tener distintas 
variables aleatorias asociadas a un mismo experimento. En cada caso particular el 
experimentador debe decidir cuáles son las variables aleatorias que le interesan. 
Generalmente, procuramos trabajar con las variables aleatorias cuyas funciones 
reflejaii, con la máxima simplicidad posible, las propiedades de los resultados del 
experimento que son realmente esenciales. 

Notaciones. Ordinariamente se emplean para representar variables aleato- 
rias unidimensionales letras mayúsculas tales como X, Y, Z. E1 resultado de un 
experimento se representa con la letra griega <o. Así que, X(o) representa aquel 
número real que en la variable aleatoria X está asociado al resultado u. 

A continuación damos algunos ejemplos sencillos de variables aleatorias. 

ejemplo 1. Un experimento consiste en echar un dado y leer el número de 
puntos conseguido. La variable aleatoria más «natural» a considerar es el número 
grabado por el fabricante en el dado, a saber: 

X(co) = co para co = 1,2, 3,4, 5, 6. 

Si estamos interesados en si el número de puntos es par o impar, debemos consi- 
derar otra variable aleatoria Y, definida como sigue: 

Y(co) = 0 si c» es par, 

Y(co) = 1 si co es impar. 


(*) La expresión «variable estocástica» se usa también como sinónimo de «variablei 
aleatoria». La palabra «estocástica» procede de una raíz griega que signifìca «suerte» y según 
parece fue inventada por Jakob Bemoulli y se usa frecuentemente en la literatura de la 
teoría de probabilidades. 
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Los valores 0 y 1 no son esenciales —podría utilizarse cualquier par de números 
reales distintos. No obstante, 0 y 1 sugieren «par» o «impar», respectivamente, 
porque representan el resto que se obtiene al dividir el resultado a> por 2. 

ejemplo 2. Se lanza una flecha hacia un blanco circular. E1 conjunto de 
todos los resultados posibles es el de todos los puntos *> del blanco. Si imaginamos 
un sistema de coordenadas colocado en el blanco con el origen en su centro, pode- 
mos asignar diversas variables aleatorias a este experimento. Una de ellas es la 
variable bidimensional que asigna al pxmto o> sus coordenadas rectangulares (x, y). 
Otra es el par de coordenadas polares (r, 0) del punto o>. Como ejemplos de varia- 
bles unidimensionales son aquellas que asignan a cada <« una de sus coordenadas, 
tales como la x o la r. En un experimento de este tipo deseamos a menudo conocer 
la probabilidad de que la flecha toque en una determinada región del blanco, por 
ejemplo, el primer cuadrante. Este suceso se puede describir de la manera más 
simple mediante la variable aleatoria que asigna a cada punto a> su coordenada 
polar 0, así que X(o>) = 0; el suceso «la flecha da en el primer cuadrante» es el 
conjunto de valores de <« tales que 0 ^ X(o>) ^ 1 / 2 7r - 

Notaciones. Evitamos la notación engorrosa empleando notaciones bréves 
para describir ciertos tipos de sucesos y sus probabilidades. Por ejemplo, si t es un 
número real, el conjunto de todos los <» del espacio muestral tales que X(<») = t se 
representa brevemente poniendo 


X=t. 

La probabilidad de ese suceso se nota P(X = t) en lugar de poner P({o>\X(o>) = í}). 
Los símbolos tales como P(X = a o X = b) y P(a < X ^ b) se definen de modo 
parecido. Así pues, el suceso «X = a o X = b» es la reunión de los dos sucesos 
«X = a» y «X = b »; el símbolo P(X = a o X = b) representa la probabilidad 
de esa reunión. E1 suceso «a < X ^ b» es el conjunto de todos los puntos «> tales 
que X(<«) pertenece al intervalo semiabierto (a, è], y el símbolo P(a < X ^ b) 
representa la probabilidad de ese suceso. 

14.4 Ejercicios 


1. Sea X una variable aleatoria unidimensional. 

a) Si a < b, demostrar que los dos sucesos a<X<byX<a son disjuntos. 

b) Determinar la reunión de los dos sucesos de la parte a). 

c) Demostrar que P(a < X < b) = P(X < b) — P(X < a). 

2. Sea (X, Y) una variable aleatoria bidimensional definida sobre un espacio muestral S. 
Esto significa que (X, Y) es una función que asigna a cada a de S un par de números 
reales (X(u), Y(u)). Naturalmente, cada X y cada Y es una variable aleatoria unidi- 
mensional definida en S. La notación 


X<.a, Y <,b 
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reprcsenlíi el conjunto de todos los clemcntos u dc S tales quc X(u) < a y V(w) < b. 

a) Si a < b y c < d, expresar, en función de los elemcntos de S, el signilicado de la 
siguientc notación: a < X < b, c < Y < d. 

b) Demostrar que los dos sucesos «X < a. Y < c» y «X < a, c < Y < d» son dis- 
juntos. Intcrpretar geométricamente esos succsos. 

c) Determinar la reunión de los dos sucesos del apartado b). 

d) Generalizar el ejercicio 1 c) al caso bidimcnsional. 

3. Sc eehan dos dados corrcctos, siendo cada rcsultado un par ordenado (a, b), sicndo 
a y b enteros del 1 al 6. Sea X la variable aleatoria quc asigna el valor a + b al resul- 
tado (a, b). 

a) Describir, en la notación en lista, los succsos «X = 7», «X = 11», «X = 7 ó 
X = 11». 

b) Calcular las probabilidades dc los sucesos de la parte a). 

4. Considercmos un experimento cn el que se lanzan cuatro moncdas simultáncamcnte 
(o una moneda se lanza cuatro veces). Para cada moneda definimos una variable alea- 
toria que asigna el valor 1 a la cara y el 0 a la cruz, y representemos esas variables 
aleatorias por Xj, Xj, Xa, X», asignando las probabilidades P(X, = 1) = P(X, = 0) = Vj 
para cada Xi Considerar una nueva variable aleatoria y que asigne a cada resultado 
el número total de caras de las cuatro monedas. Expresar Y en función de 
X),X»,X»,X 4 y calcular las probabilidades P(Y= 0), P(y=l), y P(y<l). 

5. Una pequefia companía ferroviaria tiene medios para el transporte de 100 pasajeros 
por día entre dos ciudades, por un costc (para la companía) de 7 $ por pasajcro. Si 
algún día compran billetes más de 100 pasajeros la companía está obligada a propor- 
cionar transporte en autobús a los pasajeros que exceden por un coste de 10 S por 
persona. Sea X la variable aleatoria que representa el número de pasajeros que com- 
pran billetes en un día determinado. Los valores posibles de X son los enteros 
0, 1, 2, 3, ... hasta una cierto máximo desconocido. Si con Y representamos la variable 
aleatoria que expresa el coste total diario (en dólares) para la compafiía por los pasajeros 
despachados, expresar Y en función de X. 

6. Una factoría de producción en cadena consta de dos estaciones de trabajc A y B. 
En la estación A, se montan X unidades por hora; inmediatamente són' transportadas a 
la estación B, donde son inspeccionadas a razón de Y unidades por hora, siendo 
y < X. Los posibles valores de X e Y son los enteros 8, 9 y 10. Si Z es la variable alea- 
toria que representa el número de unidades que salen de la cadena en la primera hora 
de producción: 

a) Expresar Z en función de X e Y, suponiendo cada X y cada Y constantes durante 
esta hora. 

b) Describir, de manera parecida, la variable aleatoria U que cuenta el número de 
unidades producidas en las dos primeras horas. Cada una de las X e Y es constante 
durante cada hora, pero los valores constantes durante la segunda hora no deben 
necesariamente coincidir con los de la primera. 

14.5 Funciones de distribución 

Volvemos de nuevo al problema del cálculo de probabilidades de un suceso 
asociado a una cierta variable aleatoria. Sea X una variable aleatoria unidimensio- 
nal definida en un espacio muestral S, siendo S un conjunto de Borel en E n para 
n ^ 1. Sea P una medida de probabilidad definida en los subconjuntos de Borel 
de S. Para cada m de S, X(co) es un número real, y cuando m recorre los elementos 
de S los números X(m) recorren un conjuhto de números reales (el recorrido de X). 
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Este conjunto puede ser finito, infinito numerable, o no numerable. Para cada 
número real t consideramos el siguiente subconjunto de S : 

A{t) = {to\X(w)<t). 

Si t es menor que todos los números del recorrido de X, el conjunto A(t) será 
vacío; de lo contrario, A(t) será un subconjunto de S no vacío. Suponemos que 
para cada t el conjunto A(t) es un suceso, esto es, un conjunto de Borel. De acuer- 
do con el convenio establecido al final de la sección 14.3, representamos este 
suceso con el símbolo X ^ t. 

Suponemos conocida la probabilidad P(X ^ t) para todo t real. Este conoci- 
miento nos permitirá calcular las probabilidades de otros muchos sucesos de 
interés. Para lograrlo se usan las probabilidades P(X ^ t) como base para la cons- 
trucción de una nueva función F, llamada función de distribución de X que se 
define de la manera siguiente: 

DEFINICIÓN DE funciÓN DE distribución. Sea X una varictble aleatoria uni- 
dimensionál. La función F definida para todo t real mediante la ecuación 

F(t) = P(X < t) 

se llama la función de distribución de la variable aleatoria X. 

Observación. Algunas veces, la notación F* se utiliza para resaltar el hecho 
de que la función de distribución está asociada a una cierta variable X. Entonces 
el valor de la función en t se escribe F*(í). 

Es importante darse cuenta de que la función de distribución F está definida 
sobre el eje real completo, aun cuando el recorrido de X puede ser una porción 
acotada del eje real. En efecto, si todos los números X(o>) están en un cierto inter- 
valo finito [a, b~\, entonces para t < a la probabilidad P(X ^ t) es cero (ya que 
para t < a el conjunto X ^ t es vacío) y para t^b la probabilidad P(X ^ t) 
es 1 (debido a que en este caso el conjunto X ^ t es el espacio muestral completo). 
Esto significa que para variables aleatorias X acotadas cuyo recorrido está dentro 
de un intervalo [a, 6] tenemos F(t) = 0 para todo t <a y F(t) = 1 para todo 
t > b. 

Procederemos ahora a deducir un cierto número de propiedades comunes a 
todas las funciones de distribución. 

teorema 14.2. Si F es una función de distribución de una variable aleato- 
ria unidimensional X, entonces 

a ) 0 < F(t) < 1 para todo t. 

b) P(a < X < b) = F(b) — F(a) si a < b. 

c) F(a) < F(b) si a < b. 



628 


Cálculo de probabilidades 


Demostración. La parte a) se deduce inmediatamente de la definición de 
F porque la probabilidad está siempre comprendida entre 0 y 1. 

Para demostrar b) observemos que los sucesos «a < X — b» y «X — a» son 
disjuntos. Su reunión es el suceso «X — b». Aplicando la aditividad obtenemos 

P{a < X < b) + P(X £ a) = P(X<,b), 

que también se puede poner en la forma 

P(a < X < b) = P(X <b)- P(X <,a) = F(b) - F(a). 

La parte c) se deduce de b) puesto que P(a < X ^ b) ^ 0. 

Observación: Usando Ia analogía de la masa, diríamos que F(t) representa la 
cantidad total de masa situada entre — <*> y t (incluyendo el mismo punto t). La 
cantidad de masa localizada en el intervalo semiabierto (a, 6] es F(b) — F(a). 


F(t) F(t) 



Ficura 14.1 Función de distribución de Figura 14.2 Función de distribución de una 
una variable aleatoria acotada. variable aleatoria no acotada. 

La figura 14.1 nos muestra una función de distribución de una variable alea- 
toria acotada X cuyos valores X(a>) están en el intervalo [0, 1]. Este ejemplo es 
conocido como distribución uniforme. En él tenemos 

F(t) = 0 para t < 0 , F(t) = t para 0 < t < 1 , F(t) = 1 para t > 1 . 

En la figura 14.2 se ve un ejemplo de una función de distribución correspon- 
diente a una variable aleatoria no acotada. Este ejemplo se conoce con el nombre 
de distribución de Cauchy y sus valores vienen dados por la fórmula 


F(t) = - + - arctan t . 
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Más adelante veremos casos prácticos que conducen a distribuciones uniformes 
y de Cauchy. 

Observación: Con el símil de la masa, diríamos que en la figura 14.1 no existe 
masa situada a la izquierda del origen o a la derecha del punto 1. Toda la masa ha 
sido distribuida en el intervalo [0,1]. La gráfica de F es una recta sobre ese inter- 
valo porque la masa está extendida con densidad uniforme. En la figura 14.2 la masa 
está distribuida a lo largo de todo el eje. La gráfica no es lineal porque la masa está 
extendida con densidad variable. 

E1 teorema 14.2 b) indica cómo calcular (en función de F) la probabilidad 
de que X esté en un intervalo semi-abierto de la forma (a, b]. E1 teorema que 
sigue se refiere a otros tipos de intervalos. 

teorema 14.3. Si F es una función de distribución de una variable alea- 
toria uni-dimensional X, entonces si a<b tenemos: 

a) P(a<X<b) = F(b) - F(a) + P(X = a). 

b) P(a < X < b) = F(b) - F(a) - P(X = b). 

c) P(a < X < b) — F(b) - F(a) + P(X = a) - P(X = b). 

Demostración. Para demostrar a) observemos que los sucesos «a < X ^ b» 

y «X = a» son disjuntos y su reunión es «a ^ X ^ b». Teniendo en cuenta la 
aditividad y el teorema 14.2 b) obtenemos a). Las pártes b) y c) se demuestran en 
forma parecida. 

Observemos que los cuatro sucesos 
a<X<,b, a<,X£b, a<X<b, y a£X<b 

tienen igual probabilidad si y sólo si P(X = a) = 0 y P(X = b) = 0. 

Los ejemplos representados en las figuras 14.1 y 14.2 hacen ver otras dos 
propiedades que tienen todas las funciones de distribución, y que se describen en 
el teorema siguiente. 

teorema 14.4. Si F es la función de distribución de una variable aleatoria 
uni-dimensional X, entonces 

(14.1) lim F(t) = 0 y lim F(t) = 1. 

Demostración. La existencia de los dos límites de (14.1) y el hecho de que 
los dos límites estén entre 0 y 1 se deduce al momento, puesto que F es una fun- 
ción monótona cuyos valores están entre 0 y 1. 

Designemos los límites de (14.1) con y L 2 respectivamente. Para demos- 
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trar que Li = 0 y que L 2 = 1 emplearemos la propiedad de aditividad numerable 
de la probabilidad. A tal fin expresemos la totalidad del espacio S como una 
reunión numerable de sucesos disjuntos: 

S = U^(—n < X < —n + 1) u U(n < X < n + 1). 

Entonces, por la aditividad, obtenemos 

p (S) =ì p (- n < x < -» + 1) + ï p (n < X < n + 1) 

£ N 

= m™oo + !) - +(“«)] + Hm 2 [F(n + 1) - F(n)]. 

Las sumas del segundo miembro se simplifican unas con otras, dándonos 
p ( s ) = Hm[E(°) - F(-M)] + Hm [F(N + 1) - F(0)] 

= F( 0) - Li + L 2 - F(0) = L 2 -L x . 


Puesto que P(S) = 1, esto demuestra que U - Li = 1 o sea U = 1 + L lt Por 
otra parte, tenemos también que L 2 ^ 1 y > 0. Esto implica que L 2 = 0 y 
Li = 1, como se afirmó. 

14.6 Discontinuidades de las funciones de distribución 

En la figura 14.3 se muestra un ejemplo de una posible función de distribu- 
ción con discontinuidades. Utilizando la analogía de masas diríamos que F tiene 
una discontinuidad de salto en cada punto que soporta una cantidad positiva de 
masa. E1 teorema que sigue muestra que el salto es igual a la cantidad de masa 
concentrada en el punto correspondiente. 



Figura 14.3 Una posible función de Figura 14.4 Discontinuidad de salto 

distnbución. de una función de distribución. 
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teorema 14.5. Si F es una función de distribución de una variable aleatoria 
uni-dimensional X, entonces para cada valor real t tenemos 

(14.2) lim F(t) = F(a) 

y 

(14.3) Hmf(í) = F(a) - P(X = a). 


Observación: La relación entre límites (14.2) nos dice que F es continua a 
la derecha de cada punto a, debido a que F(t) —> F(a) cuando t —» a por la dere- 
cha. Por otra parte, la ecuación (14.3) nos dice que cuando t —> a por la izquierda, 
F(t) tiende hacia F(a) si y sólo si la probabilidad P(X = a) es cero. Cuando 
P(X = a) no es cero, la gráfica de F tiene una discontinuidad de salto en a del 
tipo de la que se ve en la figura 14.4. 

Demostración. La existencia de los límites resulta inmediatamente de la mo- 
notonía y acotación de F. Vamos a demostrar que los límites tienen los valores 
indicados. A tal i n utilizamos la parte b) del teorema 14.2. Si t > a escribimos: 


(14.4) F(t) = F(á) + P(a < X <t); 
si t < a, ponemos 

(14.5) F(t) = F(á) -P(t<X<,a). 

Haciendo t -> a+ en (14.4) encontramos 

lim F(t) = F(a) + lim P(a < X < t), 

mientras que si t-> a— en (14.5) obtenemos 

lim F(t) = F(a) -limP(í < X < a). 

Por lo tanto para demostrar (14.2) y (14.3) debemos establecer dos igualdades: 

(14.6) lim P(a < X < t) = 0 

y 


(14.7) 


lim P(t < X <a) = P(X = a). 
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Intuitivamente pueden establecerse así: Cuando t -> a+ , el intervalo semiabierto 
(a, í] tiende a confundirse con el conjunto vacío. Esto es, la intersección de todos 
los intervalos semiabiertos (a, í], para t > a, es vacía. Por otra parte, cuando 
t -> a — el intervalo semiabierto (í, a] tiende a confundirse con el punto a. (La 
intersección de todos los intervalos (í, a] para t < a es el conjunto {a}.) Por con- 
siguiente, si la probabilidad se comporta de manera continua, las igualdades (14.6) 
y (14.7) deben ser ciertas. Para seguir este razonamiento en forma rigurosa vamos 
a hacerlo del siguiente modo: 

Para cada entero n > 1, sea 


(14.8) p n = P^a < X < a + ^ . 

Para demostrar (14.6) basta con demostrar que p n -*0 cuando n Represen- 
tando con S„ el suceso 

a H--— < X < a + -. 

n + 1 n 

Los conjuntos S„ son disjuntos y su reunión u S 2 u S 3 u.es el suceso 

a < X ^ a + 1. Por la aditividad numerable tenemos: 

(14.9) ÎP(Sn) = P(a < X <, a + 1) = Pl . 

Por otra parte, la igualdad (14.8) implica que 


Pn - Pn+l = . 


así que de (14.9) obtenemos la relación 
(14.10) 2(P„ “ Pn+l) = Pl- 

La convergencia de la serie es una consecuencia de (14.9). Pero la serie del primer 
miembro de (14.10) tiene por suma 


Pl — lim p„. 

Por lo tanto (14.10) implica que lím p„ = 0, y esto prueba (14.6). 

Una ligera modificación de este razonamiento nos permite demostrar también 
(14.7). Puesto que 


P(t < X < a) = P(t < X < a) + P(X = a) 
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tan sólo necesitamos demostrar que | 

limP(t < X <a) = 0. 

A tal fin introducimos los números 

- ^(a - ì < JT < «) 

y demostramos que q„ -» 0 cuando n -» °o. En este caso consideramos los sucesos 
T„ dados por 

a--<X< > a--^ r 
n n + 1 

para n = 1, 2, 3,_Esos son disjuntos y su reunión es el suceso a — 1 < X < a, 

así que tenemos 

i P(T„) = P(a - 1 < X < a) = q t . 

Observemos ahora que q„ — q„ +1 = P(T„), y podemos completar la demostración 
como antes. 

E1 tipo más general de distribución es cualquier función real F con las pro- 
piedades siguientes: 

a) F es monótona creciente en el eje real. 

b) F es continua a la derecha de cada punto. 

c) lím F(f) = 0 y lím F(í) = 1 . 

En efecto, puede demostrarse que para cada una de esas funciones F existe 
una correspondiente función de conjunto P, definida sobre los conjuntos de Borel 
del eje real, tal que P es una medida de probabilidad que asigna la probabilidad 
F(b) — F(a) a cada intervalo semiabierto ( a, b]. Puede verse una demostración de 
esto en H. Cramér, Mathematical Methods of Statistics, Princeton University Press, 
Princeton, N. J., 1946. 

Existen dos tipos especiales de distribuciones, llamadas discretas y continuas, 
que en la práctica tienen particular importancia. En el caso discreto toda la masa 
está concentrada en un número de puntos finito o infinito numerable, mientras 
que en el continuo la masa está esparcida, con espesor uniforme o variado, a lo 
largo de todo el eje real. En las próximas secciones se tratan con cierto detalle 
esos dos tipos de distribuciones. 
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14.7 Distribuciones discretas. Funciones de masa de probabilidad 

Sea X una variable aleatoria uni-dimensional y consideremos una nueva fun- 
ción p, llamada función de masa de probabilidad de X. Sus valores p{t) están defi- 
nidos para todo número real t mediante la ecuación 

p(t) = P(X=t). 

Esto es, p(t) es la probabilidad de que X tome el valor t. Cuando deseemos poner 
de manifiesto que p está asociado a X escribimos p x en lugar de p y p x (t) en 
lugar de p(t). 

E1 conjunto de números reales t para los cuales p(t) > 0 es finito o numera- 
ble. Lo expresamos por T; esto es, ponemos 

T= {t\p(t) > 0}. 

La variable aleatoria X se llama discreta si 

2p( 0 = 1- 

Dicho de otro modo, X es discreta si una unidad de masa de probabilidad está 
distribuida sobre el eje real concentrándose una masa positiva p(t) en cada punto 
t de un cierto conjunto T finito o infinito numerable y en los restantes puntos no 
hay masa. Los puntos de 7' se llaman puntos de masa de X. 

Para variables aleatorias discretas el conocimiento de la función de masa de 
probabilidad nos permite calcular la probabilidad de sucesos arbitrarios. Tene- 
mos, efectivamente, el siguiente teorema. 

teorema 14.6. Si A es un subconjunto de Borel de la recta real R, y si 
designamos con P(X e A) la probabilidad del conjunto de w tal que X(o>) e A, 
entonces 

(14-11) P(*e,4)= 2 P(x), 

xeAnT 

donde T es el conjunto de puntos de masa de X. 

Demostración. Puesto que A n Tç A yT—AsR — A, 

(14 ' 12) xJn/ (X) - P(XeA) y x 2_ a P( x )<P( X t A )- 
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Pero A n T y T — A son conjuntos disjuntos cuya reunión es T, así que la se- 
gunda desigualdad de (14.12) es equivalente a 

1 - 2 P(x) < 1 - P(X e A) o 2 P(x) ^ P(X e ^). 

xeA nT leinT 

Combinando esto con la primera desigualdad (14.12) obtenemos (14.11). 

Observación: Puesto que p(x) = 0 cuando x $ T, la suma del segundo miem- 
bro de (14.11) puede ponerse en la forma^e.í p(x)s,m peligro de confusión. 

Cuando A es el intervalo (— °°, f], la suma de (14.11) da el valor de la 
función de distribución F(t). Así pues, tenemos 

F(t) = P(X<t) = Zp(x). 

Si una variable aleatoria es discreta, la función de distribución correspondiente F 
también es discreta. 

Los ejemplos que siguen de distribuciones discretas se presentan frecuente- 
mente en la práctica. 

ejemplo 1. Distribución binomial. Sea p un número real que satisface la 
acotación O^p^l y sea q = 1 — p. Supongamos una variable aleatoria que 
toma los valores 0, 1, 2, 3, .... n, siendo n un entero positivo fijo, y admitamos 
que la probabilidad P(X = k) viene dada por la fórmula 



j) La función masa. b) La función de dîstribución. 


Figura 14.5 Las junciones de masa de probabilidad y de distribución de una variable 
aleatoria discreta con una infinidad numerable de puntos de masa n = 5 y p = J. 
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Esta asignación de probabilidades es legítima porque la suma de todas ellas es: 


Ỳ P{X = fe ) =2(fc)pV-‘ ={p + q) n = 1 • 

La correspondiente función de distribución F x se denomina distribución binomial 
de parámetros n y p. Sus valores pueden calcularse mediante la fórmula de su- 
mación 


FxO) = 2 

0 <k<t ' * 

La distribución binomial se presenta de manera natural en el caso de una 
sucesión de pruebas de Bernoulli si p es la probabilidad de un suceso y q la del 
suceso contrario. Efectivamente, cuando la variable aleatoria X cuenta el núme- 
ro de veces que se presenta el suceso en n pruebas, P(X = k) es precisamente 
(k)p k q n ~ k en virtud de la fórmula de Bernoulli. (Véase el teorema 13.3 de la sec- 
ción 13.16.) La figura 14.5 muestra las gráficas de la función de masa de proba- 
bilidad y la función de distribución correspondiente para una distribución bino- 
mial con parámetros n = 5 y p = 

ejemplo 2. Distribución de Poisson. Sean A. un número real positivo y X 
una variable aleatoria que toma los valores 0, 1, 2, 3,... . Si la probabilidad 
P(X = k) está dada por la fórmula 

P(X = k) = ^f para k = 0,1,2. 

k\ 

la función de distribución correspondiente F x se llama distribución de Poisson de 
parámetro A. Se denomina así en honor del matemático francés S. D. Poisson 
(1781-1840). Esta asignación de probabilidades es válida porque 

^p(X = k) = £ = c ~ V = 1 . 


Los valores de la función de distribución se calculan con las sumas parciales 


F x (t) = e- x J 


k\' 


La distribución de Poisson es aplicable a diversos problemas relativos a su- 
cesos aleatorios que se presentan en el transcurso del tiempo, tales como acciden- 
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tes de tráfico, conexiones equivocadas en una central telefónica, e intercambios de 
cromosomas en las células provocados por rayos X. En los libros de Feller y 
Parzen, que al final del capítulo se citan, se discuten algunas aplicaciones par- 
ticulares. 


14.8 Ejercicios 


1. Se lanza un dado correcto. Como variable aleatoria X tomamos la función que cuenta 
el número de puntos conseguidos con el dado. Dibujar la gráfica de la correspondiente 
función de distribución F x . 

2. Se lanzan dos dados. Sea X la variable aleatoria que cuenta el total de puntos 
conseguidos. Construir una tabla que dé los valores no nulos de la función de masa de 
probabilidad p x y dibujar la gráfica de la función de distribución F x . 

3. La función de distribución F de una variable aleatoria X viene definida como sigue 


F(t) 


( 0 si t < —2, 

\ si -2<f<0, 

f si 0út<2, 

1 si t^2. 


a) Dibujar la gráfica de F. 

b) Describir la función de masa de probàbilidad p y representarla. 

c) Calcular las siguientes probabilidades:P(X = 1), P(X <, 1 ),P(X < 1), P(X = *2) 
P(X < 2), P(0 < X < 2), P(0 <X <,2),P(l < X < 2). 

4. Considérese una variable aleatoria X cuyos posibles valores son todos los números ra- 


'('-;tì)-'('- 1 t ì )-ï î »' 


comprobar que esta asignación de probabilidades es correcta y disenar la forma de la 
gráfica de la función de distribución F x . 

5. La función de masa de probabilidad p de una variable aleatoria X es nula salvo en 
los puntos t — 0, 1, 2. En ellos toma los valores 


p( 0) = 3c 3 , p( 1) = 4c - 10c 2 , p( 2) = 5c - 1, 


para un cierto c > 0. 

a) Determinar el valor c. 

b) Calcular Ias probabilidades: P(X < 1),P(X < 2),P(\ < X <2),P(0 < X < 3). 

c) Describir y representar la función de distribución F. 

d) Hallar el mayor valor de t tal que F(t) < j . 

e) Hallar el menor valor de t tal que F(t) > 
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6. Una variable aleatoria X tiene distribución binomial con parámetros n = 4 y p = 1 

a) Describir y representar Ia función de masa de probabilidad p. 

b) Describir y representar la función de distribucíòn F. 

c) Calcular las probabilidades P(1 < X < 2)y P(1 < X < 2). 

7. Supongamos que una chincheta se echa sobre la mesa, y cae o con la punta hacia 
arriba o en una posición estable con la punta en la mesa. Supongamos que existe una 
probabilidad p de que quede con la punta hacia arriba. 

a) Supongamos que se echan en la mesa dos chinchetas idénticas. Admitiendo la 
tndependencia estocástica, demostrar que la probabilidad de que ambas queden con 
la punta hacia arriba es p 2 . 

b) Continuando la parte a), sea X la variable aleatoria que cuenta el número de 
chinchetas que quedan con la punta hacia arriba (Ios valores posibles de X son 0, 1 y 
2). Calcular las probabilidades P(X = 0) y P(X = 1). 

c) Representar la función de distribución F x cuando p = J. 

8. Dada una variable aleatoria X cuyos valores posibles son 1,2, Admitamos que 

la probabilidad P(X = k) es proporcional a k. Determinar la constante de proporcio- 
nalidad, la función de masa de probabilidad p x , y la de distribución F x . 

9. Dada una varìable aleatoria X cuyos valores posibles son 0,1,2,3,... . Admitamos 
que P(X = k) es proporcional a , donde c es un número real fijo. Determinar la 
constante de proporcionalidad y la función de masa de probabilidad p. 

10. a) Se lanza un dado correcto. E1 espacio muestral es S ={1, 2, 3, 4, 5, 6}.Si el número 
de puntos conseguidos es impar, un jugador recibe un dólar; en el caso contrario debe 
pagar un dólar. Sea X la variable aleatoria que mide el resultado (número de dólares) 
en cada partida del juego. (Los valores posibles de X son +1 y -1). Describir y re- 
presentar las funciones de masa de probabilidad p x y de distribución F x . 

b) Se lanza una moneda perfecta. E1 espacio muestral es S ={W, T}(cara o cruz). 
Si f 1 resultado es cara, un jugador recibe un dólar; si es cruz paga un dólar. Sea Y Ia 
variable aleatoria que mide el resultado (número de dólares) en cada partida del juego. 
Demostrar que las funciones de masa de probabilidad p r y de distribución F r son 
idénticas a las de la parte a) de este ejercicio. Este ejemplo pone de manifiesto que 
variables aleatorias distintas pueden tener la misma función de distribución dada F. 
UPor qué?) Se dice que tales variables aleatorias están distribuidas idénticamente. 
Cada teorema relativo a una función de distribución particular es aplicable a cualquiera 
de las infinitas variables aleatorias que tengan esta distribución. 

11. Se sabe que el número de minutos que uno tiene que esperar un tren en cierta estación 
del metro es una variable aleatoria X con la siguiente función de masa de probabilidad: 

p(t) = 0 salvo para t = 3it/10 si k =0,1,2 .10. 

/'(0 = ïV si t =0, 0.3, 0.6, 0.9, 2.1, 2.4, 2.7, 3.0. 

P(0-k si t = 1.2,1.5,1.8. 

Representar la correspondiente función de distribución F. Sea A el suceso consistente 
en que uno tiene que esperar entre 0 y 2 minutos (incluyendo 0 y 2), y sea B el suceso 
de tenerrque esperarentre 1 y 3 minutos (incluyendo 1 y 3). Calcular las probabilida- 
des: P(A), P(B), P(A fl B), P(B A), P(A U B). 

12. a) Si 0 < p < 1 y q = 1 — p. demostrar que 
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siendo 


Qn 


ÛÍLÍzì 

(i -pf ‘ 


b) Dado X > 0, sea p = \/n para n > X. Demostrar que 


cuando 


y que 


(ï) f 


-► — e ■* cuando i 


oo. 


Este resultado sugiere que para n grande e y pequeno, la distribución binomial es apro- 
ximadamente la misma que la de Poisson, con tal que el producto np sea casi cons- 
tante; esta constante es el parámetro X de la distribución de Poisson. 


14.9 Distribuciones continuas. Funciones de densidad 

Sea X una variable aleatoria unidimensional y F su función de distribución, 
de modo que F(í) = P(X t) para todo t real. Si la probabilidad P(X = t) es 
cero para todo t, entonces, en virtud del teorema 14.5, F es continua en todo el 
eje real. En este caso F se llama distribución continua y X es una variable alea- 
toria continua. Si existe la derivada F' y es continua en el intervalo [a, í] puede 
hacerse uso del segundo teorema fundamental del cálculo y escribir: 


(14.13) F(t)-F(a) = \j(u)du, 

siendo / la derivada de F. La diferencia F(t) —• F(a) es, naturalmente, la probabi- 
lidad P(a < X ^ t), y la desigualdad (14.13) expresa esta probabilidad como una 
integral. 

En algunas ocasiones la función de distribución F puede expresarse como una 
integral de la forma (14.13), en la que el integrando / es integrable pero no nece- 
sariamente continua. Siempre que una igualdad como la (14.13) es válida para 
todos los intervalos [a, /], el integrando / se llama función de densidad de pro- 
babilidad de la variable aleatoria X (o de la distribución F) con tal que / sea no 
negativa. Dicho de otro modo, tenemos la siguiente definición: 

DEFINICIÓN DE FUNCIÓN DE DENSIDAD DE PROBABILIDAD. Sea X Una Variable 
aleatoria continua con función de distribución F. Una función f no negativa se 
denomina densidad de probabilidad de X (o de F) si es integrable en todo el 
intervalo \_a, f] y si 


( 14 . 14 ) 


F(t) - F(a) = jj(u) du. 
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Si en (14.14) hacemos que a-> — <*>, entonces F(a) -> 0 y obtenemos la 
importante fórmula 


(14-15) F(í) = P(X ^ 0 = £ x /(«) , 

válida para todo t real. Si hacemos ahora t -> + °o y recordamos que F(t) -> 1 
encontramos que 

(14.16) ££/(«) du = 1. 

Para las variables aleatorias discretas la suma de todas las probabilidades P(X = t) 
es igual a 1. La fórmula (14.16) es la versión de la misma propiedad adaptada a 
variables aleatorias continuas. También existe una estrecha analogía entre las fór- 
mulas (14.11) y (14.15). La función densidad / desempena, para las distribuciones 
continuas, el mismo papel que la función de masa de probabilidad p para distri- 
buciones discretas; la integración reemplaza la suma en el cálculo de las proba- 
bilidades. Existe una diferencia importante, sin embargo. En el caso discreto p(t) 
es la probabilidad de que X = t, pero en el continuo f(t) no es la probabilidad de 
que (X = t). En efecto, esta probabilidad es cero debido a que F es continua 
para todo t, lo que equivale a que para una distribución continua es: 

P(a <, X <, b) = P(a < X < b) = P(a < X <, b) = P(a < X < b). 

Si F tiene una densidad / cada una de esas probabilidades es igual a la integral 

Ja /(«) du. 


Observación: Una distribución dada puede tener más de una densidad puesto 
que el valor del integrando de (14.14) puede modificarse en un número finito de 
puntos sin que por ello varíe la integral. Pero si / es continua en t entonces 
/(f) = F'(t ); en esle caso el valor de la función densidad en t está determinado con 
unicidad por F. 


Como / es no negativa, se puede interpretar geométricamente la ecuación 
(14.14) como el área del conjunto de ordenadas de / situadas a la izquierda de la 
recta x = t. E1 área de todo el conjunto de ordenadas es igual a 1. E1 área de 
la parte del conjunto de ordenadas situada encima de un intervalo dado (sea abierto, 
cerrado o semiabierto) es la probabilidad de que la variable aleatoria X tome un 
valor en tal intervalo. La figura 14.6 muestra un ejemplo de una función F de dis- 
tribución continua y de su función de densidad /. La ordenada F(t) en la figura 
14.6 a) es igual al área de la región sombreada en la figura 14.6 b). 

En las secciones que siguen vamos a ver algunos ejemplos importantes de dis- 
tribuciones continuas. 
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14.10 Distribución uniforme sobre un intervalo 

Se dice que una variable aleatoria uni-dimensional X tiene una función de 
distribución uniforme F sobre un intervalo finito [a, b] si F viene dada por las 
fórmulas siguientes: 



i h «v / /> 


a) Función de distribución F. b) Función dc densidad /. 

Figura 14.6 Una función de dist ibución uniforme sobre un intervalo [a, b~i y la 
cor'espondi nte función. de densidad. 


Ésta es una distribución continua cuya gráfica es la de la figura 14.6 a). 

La derivada F'(t) existe para todo valor de t excepto en los puntos a y b, y 
podemos escribir 




en donde / es la función de densidad, definida como sigue: 


m = 


V(b - a) 
0 


si a<t<b, 
para los demás valores de t 


La gráfica de / está representada en la figura 14.6 b). 

E1 teorema que sigue caracteriza las funciones de distribución de otro modo. 

teorema 14.7. Sea X una variable aleatoria uni-dimensional con todos sus 
valores en un intervalo finito [a, 6], y sea F la función de distribución de X. La 
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función F es uniforme sobre [c, 6] si y sólo si 
(14.17) P(XeI) = P(XeJ) 

para todo par de subintervalos I y ) de (a, 6] que tengan la misma longitud, en 
cuyo caso tenemos 

P (Xel) = -±- , 
b — a 

en donde h es la longitud de 1 .1 

Demostración. Supongamos primero que X tiene una función de distribu- 
ción sobre [c, b~\. Si [c, c + h\ es un subintervalo cualquiera de [a, b\ de lon- 
gitud h tenemos 


P(c ú X < c + h) = F(c + h) - F(c) = c ï h ~ a - = -A_ . 

b — a b — a b — a 

Esto demuestra que P(XeI) = P(X eJ) = h/(b - a) para todo par de subin- 
tervalos / y / de [a, 6] de longitud h. 

Para demostrar el recíproco, supongamos que X satisface (14.17). Observe- 
mos primero que F(t) = 0 si t < a y F(t) = 1 si t > b, ya que X tiene todos sus 
valores en [a, b\, 

Introduzcamos una nueva función g definida en el intervalo semi abierto' 
(0, b — a\ mediante la ecuación 

g(u) = P(a < X <, a + u) si 0 <u<,b-a. 

Aplicando Ia aditividad y la propiedad (14.17) encontramos 
g(u + v) = P(a <X<,a + u + v) 

= P(a<X<a + u)+P(a + u<X<,a + u + v) 

— S( u ) + P(a < X < a + v) = g(u) + g(v), 
con tal que 0 <u + v^b — a. Esto es, g satisface la ecuación funcional 
( 1418 ) g( u + v) = g(u) + g(v) 

para todas las funciones u y v tales que u > 0, v > 0, u + v ^ b — a. Esta es 
la llamada ecuación funcional de Cauchy. Demostraremos en breve que toda solu- 
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ción no negativa de la ecuación funcional de Cauchy viene dada por 

g(u) = —-— g(b — a ) para 0 < u <, b — a. 

b — a 

Aplicando esto en la ecuación (14.18) encontramos que para 0 < u ^ b — a te- 
nemos 

P(a < X < a + u) — ——— P(a < X < b) = 

b - a b - a 


ya que P(a < X < b) = 1. Es decir, 

F(a + u) - F(a) = si 0 <u<b-a. 

b — a 

Pongamos t = a + u y esta última igualdad se puede escribir en la forma 

F(t) - F(a) = si a<t<b. 

b — a 

Pero F(a) = 0 ya que F es continua por la derecha. Luego 

F(t) = si a^t<b, 

b — a 

lo que demuestra que F es uniforme en [a, 6]. 

TEOREMA 14.8. SOLUCIÓN DE LA ECUACIÓN FUNCIONAL DE CAUCHY. Si g 
es una función de valores reales definida en un intervalo semiabierto (0, c] y que 
satisface las propiedades siguientes 

a) g(u + v) = g(u) + g(v) siempre que u, v y u + v pertenezcan a (0, <?]. 

b) g es no negativa en (0, c]. 

Ehtonces g viene dada por la fórmula 


g(u) = - g(c) para 0 <u <c. 
c 

Demostración. Introduciendo un cambio de escala podemos reducir la de- 
mostración al caso particular en el que c = 1. En efecto, pongamos 

G(x) = g(cx) para 0 < x <, 1. 
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Entonces G es no negativa y satisface la ecuación funcional de Cauchy 
G(x+y) = G(x) + G(y) 

siempre que x, y,y x + y pertenezcan a (0, 1]. Si demostramos que 

(14.19) G(x) = xG( 1) para 0 < * < 1 

resulta que g(cx) = xg(c), o que g(u) = (u/c)g(c) para 0 < u ^ c. 

Si x está en (0, 1] entonces x/2 también pertenece a (0, 1] y tenemos 

UW = C © + C (Î) = 2C @- 

Por inducción, para cada x de (0,1] tenemos 

(14.20) G(x) = nG Q para n = 1, 2, 3. 

Del mismo modo, si y y my están en (0, 1 ] tenemos 

G(my) = mG(y) para m = 1, 2, 3,... . 

Haciendo y = x/n y aplicando (14.20) obtenemos 

c (r)=f c « 

si * y fflr/n están en (0, 1]. Dicho de otro modo, tenemos 

(14.21) G(rx) = rG(x) 

para todo número racional positivo r tal que x y rx estén en (0, 1]. 

Tomemos ahora un x cualquiera en el intervalo abierto (0, 1) y sean [r„] 
y {R„} de dos sucesiones númerosl racionales del intervalo (0, 1] tales que 

r n < x < R n y que lim r n = lim R n = x. 


La ecuación funcional de Cauchy y la propiedad de ser G no negativa demuestran 
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que G(x + y) G(x) así que G es monótona creciente en (0, 1]. Por consiguiente 
G(r„) < G(x) < G(R„). 

Aplicando (14.21) podemos poner esto en la forma 
r „G( 1) < C(x) < R„G( 1) ; 

Haciendo que n -> °o encontramos xG(l) ^ G(x) ^ xG(l), con lo que G(x) = 
xG( 1), lo cual demuestra (14.19). 

Observación: Las distribuciones uniformes se utilizan a menudo en experi- 
mentos cuyos resultados son puntos seleccionados al azar en un intervalo [ a■, b], 
o en experimentos que se refieren a un intervalo [a, b] como un blanco, en el que 
es imposible hacer puntería. Los términos «al azar» e «imposible hacer puntería» 
se interpretan ordinariamente para significar que si / es un subintervalo cualquiera 
de [ a,b ] entonces la probabilidad P(X G /) depende solamente de la longitud de 
/ y no de su posición en [a, b]. E1 teorema 14.7 demuestra que las distribuciones 
uniformes son las únicas distribuciones que tienen esa propiedad. 

Volvamos ahora a las cuestiones de probabilidad formuladas al comienzo de 
este capítulo. 

ejemplo. Un segmento rectilíneo se descompone en dos partes, eligiendo el 
punto de subdivisión al azar. Designemos con X la variable aleatoria que mide 
la razón de la longitud de la parte izquierda a la de la parte derecha. Determinar 
la función de distribución de probabilidad Fx- 

Solución. Utilicemos el intervalo [0, 1] para representar el segmento rectilí- 
neo y expresemos el punto de subdivisión mediante la variable aleatoria Y(o>) = o> 
para cada <o en (0, 1). Ya que el punto de subdivisión se elige al azar supongamos 
que Y tiene una función de distribución uniforme F Y sobre [0, 1]. Luego 

F Y (t) = t para 0 <, t <, 1. 

Si el segmento se parte en <o, entonces «>/(1 — ®) es la razón de la longitud 
de la parte izquierda a la de la parte derecha. Por tanto X(«>) = «>/(l — «>). 

Si t < 0 tenemos F x (t) = 0 ya que la razón X(o>) no puede ser negativa. Si 
t ^ 0, la desigualdad X(<») — < es equivalente a <o/(l —<») — /, la cual equivale a 
«> ^ t/(l + t). Por consiguiente 

FM - nx <..) - p(r £ = ^(nr,) - rr. 


puesto que 0 ^ í/(l + t) < 1. 
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Ahora podemos calcular diversas probabilidades. Por ejemplo, la probabili- 
dad de que las dos partes tengan la misma longitud es P(X = 1) = 0. En efecto, 
puesto que F x es una distribución continua, la probabilidad de que X tome un 
valor particular cualquiera es cero. 

La probabilidad de que el segmento de la izquierda sea por lo menos de lon- 
gitud doble que el de la derecha es P(X ^ 2) = 1 — P(X < 2) = 1 — % = y 3 . 
Análogamente, la probabilidad de que ei segmento de la derecha sea por lo me- 
nos de longitud doble que el de la izquierda es P(X ^ %) = %. La probabilidad 
de que la longitud del segmento total sea por lo menos de longitud doble que la 
de la parte menor es P(X 5: 2) + P(X ^ %) = %. 

14.11 Distribución de Cauchy 

Se dice que una variable aleatoria X tiene una distribución de Cauchy F si 

F(t) = - + - arctan t 
2 77 


/V) f 

(t) 


! . 

/,/(0) = 1/it 




0 

0 



a) Función de distribución F. b) Función de densidad /. 

Figura 14.7 Función de distribución de Cauchy y la correspandiente función de densidad. 

para todo t real. Esta función tiene derivada continua para todo valor de t; la 
correspondiente función de densidad / viene dada por la fórmula 


Las gráficas de / y F son las de las figuras 14.7 b) y a), respectivamente. 

E1 experimento siguiente nos conduce a una distribución de Cauchy. A una agu- 
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ja que puede girar alrededor del punto (— 1, 0) del eje x se la impulsa para que 
gire y se la deja parar espontáneamente. Un resultado del experimento es el án- 
gulo 6 que forma la aguja con el eje x; 6 se mide de modo que \it. 

Razonando de manera parecida a como se ha hecho en el ejemplo 1 se demuestra 
que la variable aleatoria X definida por X(6) = 6 tiene una distribución uniforme 
sobre el intervalo con densidad f x (t) = ì si — ì-tt < t < \tt . 

Consideremos ahora la variable aleatoria 7 definida por 

7(0) = tan 0. 

Demostraremos ahora que 7 tiene una distribución de Cauchy Fy si X tiene 
distribución uniforme sobre [— y 2 ir, %ir]. 

Si a < t sea a = arc tan a y 6 = arc tan t. Tenemos entonces, 

Fy(t) - Fy(a) = P(a < Y < t) = P(« < X <, 0) = £/*(“) du = . 

Ya que « -*• — ~/2 cuando a — °° encontramos: 

F y (t) = () - n = - arctan 1 + ~- 

Esto nos demuestra que 7 tiene una distribución de Cauchy. 


14.12 Ejercicios 

1. Una variable aleatoria X tiene función de distribución continua F, siendo 

fO si / <£ 0, 

F(í) = jc/ si 0</^l, 

[l si / > 1. 

a) Determinar la constante c y describir la función densidad /. 

b) Calcular las probabilidades P(X = y),P(X < J),P(|Y| < 3 ). 

2. Sea f(t) = c |sen <| para íf| < tt/2 y /(/) = 0 para los demás valores de t. Determinar 
el valor de la constante c de manera que / sea la densidad de una función de distribu- 
ción continua F. Describir, también, F y representarla. 

3. Resolver el ejercicio 2 si /(/) = c(4t — 2/ 2 ) para 0 < / < 2, y /(/) = 0 para los demás 
valores de /. 

4. E1 tiempo en minutos que una persona espera un autobús es una variable aleatoria con 
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función de densidad / dada por las fórmulas siguientes: 


f{t) = 1 para 0 < t < 1, /(í) = | para 2 < / < 4, /(/) = 0 para los demás 

valores de t. 

Calcular la probabilidad de que el tiempo de espera sea a) mayor que un minuto; 
b) mayor que dos minutos; c) mayor que tres minutos. 

5. Una variable aleatoria X tiene una función de distribución continua F y una densidad 
de probabilidad /. La densidad tiene las propiedades siguientes: /(f) = 0 si t < J 
/(ì) = 1 ,/(í)es lineal si J < / < |, /(1 - t) = f(t) para todo /. 

a) Representar /. 

b) Dar un conjunto de fórmulas que determinan F y representarla. 

c) Calcular las probabilidades: P(X< 1), P(X<|),P(X<ì), P(X< i), P(|<X< f). 

6. Una variable aleatoria X tiene una distribución uniforme sobre [—3,3]. 

a) Calcular P(X = 2), P(X < 2), P(|X| < 2), P(\X - 2| < 2). 

b) Hallar un valor de t para el que P(X > t) =£. 

7. La Companía Lethe Subvvay tiene senalado un tren en dirección norte cada 30 minutos 
en cierta estación. Sea X la variable aleatoria que cuenta el número de minutos que un 
hombre, que entró en la estación en un tiempo aleatorio, debe esperar el próximo tren. 
Supongamos que X tiene una distribución uniforme en el intervalo [0,30]. (Este es el 
sentido que debemos atribuir a la frase, el senor entra en la estación en un «tiempo 
aleatorio».) 

a) Para cada k = 5, 10, 15, 20, 25, 30, calcular la probabilidad que tiene de esperar 
por lo menos k minutos para el próximo tren. 

b) Una companía competidora, la Styx Subway, está autorizada para anunciar un tren 
cada 30 minutos en dirección norte, en la misma estación, pero las llegadas de dos 
trenes de distinta companía deben diferir por lo menos 5 minutos. Supongamos que los 
viajeros entran en la estación en tiempos aleatorios y siempre toman el primer tren 
que llega. Demostrar que Ia companía Styx puede combinar su horario de manera que 
recoja hasta cinco veces el ntámero de viajeros que su competidora. 

8. Sea X una variable aleatoria con una distribución uniforme F x sobre el intervalo 
[0,1]. Pongamos Y = aX + b, donde a > 0. Determinar la función de distribución 
Fy y dibujar su gráftca. 

9. Una ruleta recorre los enteros de 0 a 36, distribuidos en 37 arcos iguales. Se pone en 
marcha la ruleta y se la deja parar libremente, y se anota el punto de la circunferencia 
junto al cual se para. Considérese este punto de parada como una variable aleatoria X 
con una distribución uniforme. Calcular la probabilidad de que X esté en un arco que 
contenga a) el entero 0; b) un entero n en el intervalo 11 < n < 20; c) un entero impar. 

10. Se dice que una variable aleatoria tiene una distribución de Cauchy con parámetros 
a y b, siendo a > 0, si su función de densidad viene dada por 


/(') 


7 ra 2 +(t - b ) 2 • 


Comprobar que la integral de / entre -« y +” es 1, y determinar la función de 
distribucion F. 

11. Sea /,(« = 1 para 0 < t < 1 , y fi(t) = 0 para los demás valores de t. Defmamos una 
sucesion funcional {/„} mediante la fórmula recurrente 


/«+lW = /"./lí* - OfniOdt. 



Distribuciones exponenciales 


649 


a) Demostrar que / B+ x (jc) = 

b) Esbozar las gráficas de /i, /2 y /3. 

12. Respecto al ejercicio 11. Demostrar que cada función /„ es una densidad de probabilidad. 

14.13 Distribuciones exponenciales 

Sea A. una constante positiva. Se dice que una variable aleatoria uni-dimen- 
sional X tiene una función de distribución exponencial F con parámetro A si 

{ 1 — e~ u para t > 0, 

0 para t < 0. 

La función densidad / correspondiente viene dada por las fórmulas 

Xe~ u para í > 0, 

0 para t < 0. 

Las gráficas de F y / son parecidas a las de la figura 14.8. 

Las distribuciones exponenciales tienen una propiedad característica que su- 
giere su aplicación en ciertos problemas relativos a desintegración radiactiva, 
accidentes de tráfico, y averías en aparatos de equipos electrónicos tales como 
tubos de vacío. Esta propiedad es análoga a la que caracteriza las distribuciones 
uniformes y puede describirse del siguiente modo. 

m m 

t 


a) Función de distribución F. b) Función de densidad /. 

Figra 14.8 Distribución exponencial y función de densidad correspondiente. 




m = 
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Designemos con X el tiempo transcurrido hasta que una pieza del equipo 
falla, y sea F la función de distribución de X. Supongamos que F(t) = 0 para 
t < 0, y por el momento no imponemos otras restricciones a F. Si t > 0, entonces 
X ^ t es el suceso «el fallo sucede en el intervalo [0, /]». Luego X > t es el 
suceso complementario, «ningún fallo ocurre en el intervalo [0, í]». 

Supongamos que no se presenta fallo en el intervalo [0, í]. i,Cuál es la proba- 
bilidad de supervivencia, es decir de que no haya fallo en el intervalo [í, t + s]? 
Esta es una cuestión de probabilidades condicionadas. Queremos determinar 
P(X > t + s|X > t ), la probabilidad condicionada de que no exista fallo en el 
intervalo [0, t + s], dado que no haya existido en el intervalo [0, /]. 

Según la definición de probabilidad condicionada tenemos 


P(X > t + s | X > t) = 
(14.22) 


P[(X > t + s) n (X > Q] 
P(X > t) 


P(X > t + s) 
P(X > t) 


Supongamos ahora que F es una distribución exponencial con parámetro 
A > 0. Entonces F(t) = 1 — e~ xt para t > 0, y P(X > t) = 1 — P(X - t) = e~ xt . 
Luego la ecuación (14.22) se transforma en 


P(X > t + s I X > t) = = P(X > s). 

e 

Dicho de otro modo, si el órgano o pieza del equipo sobrevive en el intervalo 
[0, f], la probabilidad de que continúe sobreviviendo en el intervalo [t, t + s] 
es igual a la probabilidad de supervivencia en el intervalo [0, s] de la misma 
longitud. Esto es, la probabilidad de supervivencia depende tan sólo de la ampli- 
tud del intervalo de tiempo y no de la edad del aparato. Expresado con la función 
de distribución F, esta propiedad establece que 

(14.23) - = 1 — F ( s ) para todo t > 0 y todo s > 0. 


E1 teorema que sigue démuestra que las distribuciones exponenciales son las 
únicas distribuciones de probabilidad con esa propiedad. 

teorema 14.9. Si F es una función de distribución de probabilidad que 
satisface la ecuación funcional (14.23), siendo F(f)<l para t> 0, existe entonces 
una constante positiva A>0 tal que 


F(t) = 1 — e~ u para todo t > 0. 
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Demostràcìón. Sea g(/)=—log [1 —F(t)] para t> 0. Entonces 1—F(/) = 
así que para demostrar el teorema es suficiente probar que g(/) = X/ para 
un cierto X > 0. 

Ahora bien g es no negativa y satisface la ecuación funcional de Cauchy 
g(t + s)= g(t ) + g(í) 

para todo t > 0 y todo s > 0. Por consiguiente, aplicando el teorema 14.8 con 
c= 1, deducimos que g(/) = /g(l) para 0 < / 1. Pcngamos X = g(l). Enton- 
ces X = — log [1 — F(l)] > 0, y por tanto g(t) = X/ para 0 < / ^ 1. 

Para demostrar que g(/) = X/ para todo / > 0, pongamos G(t) = g(t) — X/. 
La función G también satisface la ecuación funcional de Cauchy. Además, G es 
periódica con período 1 debido a que G(/ + 1) = G(t) + G(l) y G(l) = 0. 
Puesto que G es idénticamente 0 en (0, 1] la periodicidad demuestra que 
G(/) = 0, para todo / > 0. Es decir, g(/) = X/ para todo / > 0, lo cual completa 
la demostración. 

ejemplo 1. Sea X una variable aleatoria que mide el tiempo de vida (en 
horas) de un cierto tipo de tubo de vacío. Supongamos que X tenga una distribu- 
ción exponencial con parámetro X = 0.001. E1 fabricante desea garantizar esos tu- 
bos para una duración de T horas. Determinar T de mod'o que P(X > T) = 0,95. 

Solución. La función de distribución viene dada por F(t) = 1 — e~' Kt para 
/ > 0, en donde X = 0,001. Puestc que P(X > T) = 1 - F(T) = e~ XT , elegimos 
T para que e~ XT =0,95. Luego T=-(log 0,95)/X= -1 000 log 0,95 = 51,25 + . 

ejemplo 2. Consideremos la variable aleatoria del ejemplo 1, pero con un 
valor de X no especificado. E1 razonamiento que sigue sugiere un procedimiento 
razonable para determinar X. Empezamos con un número inicial de tubos de vacío 
en el tiempo / = 0, y designemos con g(/) el número de tubos que aún funcionan 
al cabo de / horas. La razón [g(0) — g(/)]/g(0) es la fracción del número original 
que ha fallado en el tiempo /. Puesto que la probabilidad de que un tubo falle en 
el tiempo / es 1 — e~ xt , parece razonable esperar que la ecuación 

(14.24) 8(°) --g(P = ! _ 

g(0) 

sea una buena aproximación de la realidad. Si suponemos (14.24) obtenemos 
g(t) = g(0)e~ u . 

Es decir, en las hipótesis (14.24), el número g(/) obedece a una ley de deterioro 
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exponencial con deterioro constante A. E1 deterioro constante puede calcularse en 
función de la vida media. Si í, es la vida media entonces J = g(íi)/g(0) = e ~ xtl , 
así que A = (log 2)//,. Por ejemplo, si se sabe que la vida media de una gran 
muestra de tubos es 693 horas, obtenemos A = (log 2)/693 = 0,001. 

14.14 Distribuciones normales 

Sean m y o dos números reales fijos, siendo <j > 0. Se dice que una variable 
aleatoria X tiene distribución normal de media m y varianza o 2 si la función de 
densidad es 


/(í) = -4=e- 

o\I2tt 

para todo t real. La función de distribución correspondiente F es, naturalmente, 
la integral 

F(í) = j‘ e- [( “- m)/<r]2/2 du. 


<P(/) 



Figura 14.10 Función densidad de una dis- 
tribución normal de media m y varianza o 2 . 



Es evidente que esta función F es monótona creciente y continua en todo el eje 
real, y que tiende a cero cuando t— °o. También se puede demostrar que 
F(í) -> 1 cuando t -> + (Vease ejercicio 7 de la sección 14.16.) 

E1 caso particular m = 0, o = 1 es la distribución normal canónica. En tal 
caso la función F se representa ordinariamente con la letra <t>. Así pues, 

m = 7?Sj‘' ndu - 





Tabla 14.1 Valores de la funcióit de distribución normal canónica. 

®(í) =~r= \ e~ u * /2 du. 

yJlTT J-co 


/ 

0,00 

0,01 

0,02 

0,03 

0,04 

055 

0,06 

0,07 

0,08 

0,09 

0,0 

0,5000 

0,5040 

0,5080 

0,5120 

0,5160 

0,5199 

0,5239 

0,5279 

0,5319 

05359 

0,1 

0,5398 

0,5438 

0,5478 

0,5517 

0,5557 

0.5596 

05636 

0,5675 

0,5714 

0,5753 

0,2 

0,5793 

0,5832 

0,5871 

0,5910 

0,5948 

0.5987 

0,6026 

0,6064 

0.6103 

0,6141 

0,3 

0,6179 

0.6217 

0,6255 

0,6293 

0,6331 

0,6368 

0,6406 

0,6443 

0,6480 

0,6517 

0,4 

0,6554 

0,6591 

0,6628 

0,6664 

0,6700 

0,6736 

0,6772 

0 6808 

0,6844 

0,6879 

0,5 

0,6915 

0,6950 

0,6985 

0,7019 

0,7054 

0,7088 

0.7123 

0,7157 

0,7190 

0,7224 

0,6 

0,7257 

0,7291 

0,7324 

0,7357 

0,7389 

0,7422 

0.7454 

0,7486 

0,7517 

0,7549 

0.7 

0,7580 

0,7611 

0,7642 

0,7673 

0,7704 

0,7734 

0.7764 

0,7794 

0,7823 

0,7852 

0,8 

0,7881 

0,7910 

0,7939 

0,7967 

0,7995 

0,8023 

0,8051 

0,8078 

0,8106 

0,8133 

0,9 

0,8159 

0,8186 

0,8212 

0,8238 

0,8264 

0,8289 

0,8315 

0,8340 

0,8365 

0,8389 

1,0 

0,8413 

0,8438 

0,8461 

0,8485 

05508 

0,8531 

0,8554 

0,8577 

0,8599 

0,8621 

1.1 

0,8643 

0,8665 

0.8686 

0,8708 

05729 

0,8749 

0,8770 

0,8790 

0.8810 

0,8830 

1.2 

0,8849 

0,8869 

0,8888 

0,8907 

0,8925 

0,8944 

0,8962 

0,8980 

05997 

0,9015 

1,3 

0,9032 

0,9049 

0,9066 

0,9082 

0,9099 

0,9115 

0,9131 

0,9147 

05162 

0.9177 

1,4 

0,9192 

0,9207 

0,9222 

0,9236 

0,9251 

0,9265 

0,9279 

05292 

0,9306 

0,9319 

1,5 

0,9332 

0,9345 

0,9357 

0,9370 

0,9382 

0,9394 

0,9406 

0,9418 

0.9429 

0,9441 

1,6 

0,9452 

05463 

0,9474 

0,9484 

0,9495 

0.9505 

0,9515 

0,9525 

0,9535 

0.9545 

1,7 

0,9554 

0,9564 

0,9573 

0,9582 

0,9591 

05599 

0.9608 

0.9616 

0,9625 

0,9633 

1,8 

0,9641 

0,9649 

0,9656 

0,9664 

0,9671 

0,9678 

0.9686 

0,9693 

0,9699 

0.9706 

1,9 

0,9713 

0,9719 

0,9726 

0,9732 

0,9738 

0,9744 

0,9750 

0,9756 

0,9761 

0,9767 

2,0 

0,9772 

0,9778 

0,9783 

0,9788 

0,9793 

0,9798 

0,9803 

0,9808 

0,9812 

0,9817 

2,1 

0.9821 

0,9826 

0,9830 

0,9834 

0,9838 

0,9842 

0,9846 

05850 

05854 

0,9857 

2,2 

0,9861 

0,9864 

0,9868 

0,9871 

0,9875 

0,9878 

0,9881 

0,9884 

0,9887 

0,9890 

2,3 

0,9893 

0,9896 

0,9898 

0,9901 

0,9904 

0,9906 

0,9909 

0,9911 

0,9913 

05916 

2,4 

0.9918 

0,9920 

0,9922 

0,9925 

0,9927 

0,9929 

0,9931 

0,9932 

0,9934 

05936 

2,5 

0,9938 

0,9940 

0,9941 

0,9943 

05945 

0,9946 

0.5948 

0,9949 

0,9951 

0,9952 

2,6 

0,9953 

0.9955 

0,9956 

05957 

0,9959 

0,9960 

0,9961 

0,9962 

0,9963 

0,9964 

2,7 

0,9965 

0,9966 

0,9967 

05968 

0,9969 

0,9970 

0,9971 

0,9972 

0,9973 

0.9974 

2,8 

0,9974 

0,9975 

0,9976 

0,9977 

0,9977 

0,9978 

0,9979 

0,9979 

0,9980 

0,9981 

2,9 

0,9981 

0,9982 

0,9982 

05983 

0,9984 

0,9984 

0,9985 

05985 

0-9986 

0,9986 

3,0 

0,9987 

0,9987 

0,9987 

0,9988 

0,9988 

0,9989 

0,9989 

0,9989 

0,9990 

0,9990 

3,1 

0,9990 

0,9991 

0,9991 

05991 

0,9992 

0,9992 

0,9992 

0,9992 

0,9993 

0,9993 

3,2 

0,9993 

0,9993 

0,9994 

0,9994 

0,9994 

0,9994 

0,9994 

0,9995 

0,9995 

0,9995 

3,3 

0.9995 

0,9995 

0,9995 

0,9996 

0,9996 

0,9996 

0,9996 

0,9996 

0,9996 

0,9997 

3,4 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9998 

3,5 

0,9998 

0,9998 

0,9998 

0,9998 

0,9998 

0,9998 

05998 

0.9998 

0,9998 

0,9998 

3,6 

0,9998 

0,9998 

0,9999 

05999 

0,9999 

0,9999 

0,9999 

0,9999 

0,9999 

0,9999 
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E1 caso general puede reducirse al canónico introduciendo el cambio de variable 
r — (u — m)/<i en la integral que define F. Esto nos lleva a la fórmula 

La tabla 14.1 es una tabla de valores de $ (í) con cuatro cifras decimales 
para valores de t espaciados en intervalos de amplitud 0,01 desde t = 0,00 a 
t = 3,69. La gráfica de 4>(f) está representada en la figura 14.9. La gráfica de la 
densidad / es la famosa «curva de campana», dibujada en la figura 14.10. La 
parte alta de la campana corresponde a la media m. Para valores grandes de <r la 
curva se achata, y para valores pequenos de <r la curva de campana se estrecha y 
en el máximo tiene un aspecto más pronunciado, como en la figura 14.10. 

La distribución normal es una de las más impòrtantes entre las distribuciones 
continuas. Muchas variables aleatorias que se presentan en la naturaleza se com- 
portan como si su distribución fuera normal o aproximadamente normal. Como 
ejemplos citaremos la medida de la estatura de los individuos de una gran pobla- 
ción, ciertas medidas sobre grandes poblaciones de organismos vivos que se pre- 
sentan en Biología, y los errores de observación encontrados al hacer un gran nú- 
mero de mediciones. En Física, la ley de Maxvvell de las velocidades implica que 
la función de distribución de la velocidad, en cualquier dirección dada, de una 
molécula de masa M en un gas a la temperatura absoluta T es normal con me- 
diaû y varianza M/(kT) donde k es una constante (constante de Boltzmann). 

La distribución normal es también de importancia teórica debido a que pue- 
de utilizarse para aproximar las distribuciones de muchos fenómenos aleatorios. 
Un ejemplo es la distribución binomial con parámetros n y p. Si X es una varia- 
ble aleatoria con distribución binomial de parámetros n y p, la probabilidad 
P(a ^ X ^ b) viene dada por la suma 



donde q = 1 — p. Para n grande son necesarios cálculos laboriosos para hallar 
esta suma. En la práctica se evitan estos cálculos mediante la fórmula aproximada 



en donde el símbolo ~ significa que los dos miembros de 14.25 son asintótica- 
mente iguales; esto es, que la razón del primer miembro al segundo tiende a 1 
cuando n -» oo. E1 límite expresado en (14.25) es una caso particular del llamado 
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Figura 14.11 Función densidad de una distribución normal considerada como aproximación 
de la función de masa de probabilidad de una distribución binomial. 

teorema central del límite del Cálculo de probabilidades. Este teorema (discutido 
con detalle en la sección 14.30) explica la importancia teórica de la distribución 
normal. 

La figura 14.11 da una idea de la fórmula de aproximación (14.25) y mues- 
tra que puede ser exacta para un valor relativamente pequeno de n. Las rectas 
punteadas son las ordenadas de la función de masa de probabilidad p de una 
distribución binomial de parámetros «=10 y p=%. Esas ordenadas fueron calcu- 
ladas con la fórmula 


p(t) = P(X = í) = ^ para t = 0,1, 2,.. ., 10. 

Las ordenadas para t = 7, 8, 9, y 10 no han sido dibujadas porque sus valores 
numéricos son muy próximos a cero. Por ejemplo, p( 10) = (If,)'" = 2’ ,l /10 1 " = 
= 0,0000001024. La curva dibujada es la gráfica de la función densidad / de una 
distribución normal (con media m = np = 2 y varianza <r = npq = 1,6). Para 
calcular la probabilidad P(a ^ t ^ b) a partir de la función de masa p sumamos 
los valores de p(t) en los puntos en que está concentrada la masa del intervalo 
a ^ t^ b. Cada valor p(t) puede interpretarse como el área de un rectángulo de 
altura p(t) colocada sobre un intervalo de longitud unidad centrado en t. (Como 
ejemplo, vemos en la figura 14.11 un rectángulo de ésos centrado en t = 3.) La 
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fórmula (14.25) es el resultado de sustituir las áreas de esos rectángulos por el 
área del conjunto de ordenadas de / sobre el intervalo [a — b + \Ç\. 

14.15 Observaciones sobre distribuciones más generales 

En las secciones precedentes hemos comentado ejemplos de distribuciones dis- 
cretas y continuas. Los valores de una distribución discreta se calculan sumando 
los valores de la función de masa de probabilidad correspondiente. Los de una 
distribución continua se calculan integrando la función de densidad. Existen, natu- 
ralmente, distribuciones que no son discretas ni continuas. Entre éstas están las 
llamadas de tipo «mixto» en las que la distribución de masas es parcialmente dis- 
creta y parcialmente continua. (En la figura 14.3 se ha dibujado un ejemplo.) 

Una distribución F se llama mixta si puede expresarse como combinación 
lineal de la forma 

(14.26) F(í) = CjFift) + c 2 F 2 (t), 

siendo Fi discreta y F 2 continua. Las constantes c x y c 2 deben satisfacer las re- 
laciones 


0 < Cj < 1, 0 < c 2 < 1, Cl + ci = 1. 

Las propiedades de las distribuciones mixtas pueden deducirse estudiando las que 
son discretas o continuas y recurriendo entonces a la linealidad expresada en la 
igualdad (14.26). 

Un tipo de integral, conocida con el nombre de integral de Riemann-Stieltjes, 
hace posible el manejo simultáneo de los casos discreto, continuo y mixto.(*) Si 
bien esta integrai unifica el estudio teórico de las funciones de distribución, en 
cualquier problema el cálculo de las probabilidades debe reducirse a la integración 
y a la suma ordinarias. En esta exposición introductoria no pretendemos describir 
la integral de Riemann-Stieltjes. En consecuencia, gran parte de los temas los 
discutimos paralelamente, a pares, uno para el caso discreto y otro para el conti- 
nuo. Sin embargo, daremos únicamente los detalles de manera completa para uno 
de los casos, dejando para el lector el trabajo de completar los demás. 

Aun la misma integral de Riemann-Stieltjes es inadecuada para tratar las 
funciones de distribución más generales. Pero un concepto más potente, la integral 
de Lebesgue-Stieltjes (*), nos permite tratar satisfactoriamente todos los casos. Sin 
un conocimiento de este tipo de integral no se puede realizar el estudio de la 
teoría de probabilidades desde un punto de vista superior. 

(*) En el capítulo 9 de la obra del autor Análisis Matemático, Editorial Reverté, Bar- 
celona, 1963, puede verse una exposición amplia de 'la integral de Riemann-Stieltjes. 

(*) Véase cualquier libro de teoría de la medida. 
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14.16 Ejercicios 


1. Sea X una variable aleatoria que mide la vida (en horas) de un cierto tipo dc tubo de 
vacío. Supongamos que X tiene una distribución exponencial con parámctro X = 0,001. 
Determinar T de modo que P(X > T ) sea a) 0,90; b) 0,99. Puede emplearse en el cálculo 
la fórmula aproximada —log(l — x) = x + x-/2. 

2. Un material radioactivo sigue una ley de desintegración exponencial con vida media de 
2 anos. Consideremos el tiempo de desintegración X (cn anos) dc un átomo y suponga- 
mos que X es una variable alealoria con una distribución exponcncial. Calcular la pro- 
babilidad de que un átomo se desintegre a) en el intervato 1 < X < 2; b) en el intervalo 
2 < X < 3; c) en el intervalo 2 < X < 3, en el supueslo de que no se ha desintegrado 
en el intervalo 0 < X < 2; d) en el intervalo 2 < X < 3, en el supucsto de que no se 
ha desintegrado en el intervalo 1 < X < 2. 

3. La duración (en minutos) de las llamadas telefónicas a larga distancia desde Caltech se 
vio que es un fenómeno aleatorio con función densidad de probabilidad 

( ce~ tla para t > 0, 

0 para t <, 0. 

Determinar el valor de c y calcular la probabilidad de que una Ilamada a larga distan- 
cia dure a) menos de 3 minutos; b) más de 6 minutos; c) entre 3 y 6 minutos; d) más 
de 9 minutos. 

4. Dadas las constantes reales X > 0 y c. Sea 



Comprobar que J f(t) dt = 1, y determinar una función de distribución F que tenga / 
como densidad. Ésta se llama distribución exponencial con dos parámetros, un parámetro 
de amortiguamiento X y un parámetro de posición c. 

5. Establecer y demostrar una extensión del teorema 14.9 para distribuciones exponenciales 
con dos parámetros X y c. 

6. Una variable aleatoria X tiene una distribución exponencial con dos parámetros X y c. 
Sea Y = aX + b, siendo a > 0. Demostrar que Y tiene también una distribución expo- 
nencial con dos parámetros X' y c', y determinar esos parámetros en funçión de a,b,c y X. 

7. En el ejercicio 16 de la sección 11.28 se demostró que e xl dx = yf tt/2 . Utilizar este 
resultado para demostrar que para <r > 0 tenemos 

/-» cxp { _ “ 1 - 

8. Una variable aleatoria X tiene una distribución normal canónica 4>. Demostrar que 
a) *(-*) = 1 - 4>(x); b ) P(|X| < k) = 2*(k) - 1; c)P(|X| > k) = 2(1 - <t>{fc)). 

9. Una variable aleatoria X tiene una distribución normal canónica <t>. Utilizar la tabla 14.1 
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para calcular cada una de las siguientes probabilidades: a) P(X > 0); b) P(l < X < 2); 
c ) P(X < 3); d) P( X | > 2). 

10. Una variable aleatoria X tiene una distribución normal canónica <i>. Utilizar la tabla 
14.1 para encontrar un número c tal que a) P(|X| > c) — \; b) P(|X| > = 0,98. 

11. Supongamos que X tiene una función de distribución normal F con media m y varian- 
za a 2 , y designemos con 4* la distribución normal canónica. 

a) Probar que 

F(t) = • 

b) Hallar un valor de c tal que P(|X — m\ > c) = J. 

c) Hallar un valor de c tal que P(|X — m\ > c) = 0,98. 

12. Una variable aleatoria está distribuida normalmente con media m = 1 y varianza 
<7-= 4. Calcular cada una de las probabilidades siguientes: a) P( —3 < X < 3); 
b) P( —5 < X < 3). 

13. Un arquitecto está disenando un portal de un edificio que tienen que utilizar personas 
cuya altura está distribuida normalmente, con media m = 5 pies 9 pulgadas, y va- 
rianza a- siendo a = 3 pulgadas. iQué altura mínima puede dar al portal para que 
no más del 1 % de las personas choquen con su cabeza en la parte superior del mismo? 

14. Si X tiene una distribución normal canónica, demostrar que la variable aleatoria 
Y = aX + b es también normal si a ^ 0. Determinar la media y la varianza de Y. 

15. Supongamos que una variable aleatoria X tiene una distribución normal canónica, y 
pongamos Y — X 2 . 

2 rV~t 

a) Demostrar que F r (t) « —■= J tr u l 2 du si t ^0. 

b) Determinar F r (t) cuando / < 0 y describir la función densidad f r . 


14.17 Distribuciones de funciones de variables aleatorias 

Si <p es una función real cuyo dominio incluye el rango de la variable aleato- 
ria X, podemos construir una nueva variable aleatoria Y mediante la ecuación 

Y=<p(X), 

lo que significa que Y(w) =(p[X(o>)] para cada o> del espacio muestral. Si conoce- 
mos la función de distribución F x de X, icómo encontramos la distribución F Y 
de Y? Comenzamos con un caso particular importante. Supongamos que q es con- 
tinua y creciente en sentido estricto en todo el eje real. En este caso <p posee una 
función inversa ý continua y estrictamente creciente, y es: 

y = <p(x) si, y sólo si x = f(y). 

Según la definición de F Y tenemos. 


F K (0 = P(r<0 = -P[?>m</]. 
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Puesto que <p es estrictamente creciente y continua, los sucesos «q>(x) ^ t» y 
«X ^ ỳ(t)» son idénticos. Por lo tanto, P[qp(X) ^ í] = P[X ^V(í)] = FxMOL 
Luego las distribuciones F y y F x están ligadas por la ecuación 

(14.27) F r (t) = F x [y>(t)\. 

Cuando la distribución F x y la función y> son derivables podemos derivar am- 
bos miembros de (14.27), utilizando en el segundo miembro la regla de la cadena, 
para obtener 

Fy(t) = F' x [y>(t)] ■ f'(t). 

Esto nos proporciona la siguiente relación entre las densidades. 

fr(t)=fx[v>(0]-v'(t). 

ejemplo 1. Y = aX + b, a > 0. En este caso tenemos: 

<p(x) = ax + b, y>(y) = - -- , y>'(y) = - • 

a a 

Ya que q> es continua y estrictamente creciente podemos escribir: 

t *(» -ï fz (cr)- 

ejemplo 2. Y = X 2 . En este caso <p(x) = x 2 y el razonamiento anterior no 
es directamente aplicable pues <p no es estrictamente creciente. No obstante, pode- 
mos usar el mismo método para determinar Fy y fy. Por definición tenemos: 

F r (t) = P(X 2 <t). 

Si t < 0 el suceso «X 2 ^ t» es vacío y por tanto P(X 2 < t) = 0. Por consiguiente 
F r (í) = 0 para t < 0. Si t > 0 tenemos 

P(X 2 < í) = P(~Vt <X<sJt) = F x (s/~t) - F x (-s/t) + P(X = -s/t). 

Para una distribución continua F x tenemos P(X = — VT) = 0 y obtenemos la 
siguiente relación entre Fy y F x : 

0 si r<0, 

F x (s/t) - F x (-s/t) si r>0. 
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Para todo t < 0 y para aquellos valores de t > 0 tales que F x es derivable 
en VTy en — \ÍT tenemos la siguiente relación entre las densidades: 


/f(0 = 


í° . 

I /y(V 0 + fxi — 'Jt) 


2St 


si í < 0, 
si t > 0. 


Otros problemas de este tipo se discutirán en la sección 14.23 con la ayuda 
de variables aleatorias bidimensionales. 


14.18 Ejercicios 


1. Supongamos que X tiene una distribución uniforme en el intervalo [0,1]. Determinar 
la función de distribución F r y la densidad fr de la variable aleatoria Y si: 

a) Y = 3X + 1, d) Y = log|Jlf|, 

b) Y - 3X + 1, e) Y = logX 2 , 

C) Y = x\ f) r = e*. 

2. Sea X una variable aleatoria con una función de distribución continua F x . Si <p es con- 
tinua y estrictamente creciente en todo eje real y si ?(*) —> a cuando x-> —= y 
<p(x) —» b cuando x —> o°, determinar la función de distribución F r de la variable alea- 
toria Y = <p(X). Calcular también la densidad f r , suponiendo que F x y <p son deri- 
vables. 

3. Supongamos que X tiene distribución normal canónica. Determinar la función de den- 
sidad de la variable aleatoria Y cuando 

a) Y = X 2 , c) Y = e x , 

b) Y = \X\'X, d) Y = arctan X. 


14.19 Distribución de variables aleatorias bidimensionales 

E1 concepto de distribución puede generalizarse a variables aleatorias n di- 
mensionales. La consideración del caso n = 2 nos indicará como puede procederse 
en los demás. 

Si X e Y son dos variables aleatorias unidimensionales definidas en un espa- 
cio muestral común S, ( X, Y) representará la variable aleatoria bidimensional 
cuyo valor en un punto genérico <a de S queda determinado por el par de números 
reales (X(<o), y(<o)). T.a notación 

X < a, Y < b 

es una forma abreviada de designar el conjunto de todos los elementos <o de S tales 
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que X(o>) ^ a e Y(o>j ^ b; la probabilidad de este suceso se representa por 
P(X < a, Y<b). 

Análogamente se definen las notaciones a < X ^ b, c < Y ^ d, y P(a < X ^ b, 
c<Y^d). 

E1 conjunto de puntos (x, y) tales que x^aey^feesel producto cartesiano 
A X B de los dos intervalos infinitos unidimensionales A = {x\ x } y 
B — {y \ y — b}. E1 conjunto A x B se representa geométricamente por la región 
rectangular infinita dibujada en la figura 14.12. E1 número P(X — a, Y — b) re- 
presenta la probabilidad de que un punto (X(o>), Y(o>)) esté situado en esa región. 
Estas probabilidades se utilizan para definir las distribuciones de probabilidad bi- 
dimensionales. 

definición. La función de distribución de la variable aleatoria bidimensio- 
nal (X, Y) es la función real F definida para todo par de números reales a y b 
mediante la igualdad 


F(a, b) = P(X < a, Y<b). 


que también se conoce como distribución conjunta de las dos variables unidimen- 
sionales X e Y. 


Para calcular la probabilidad de que (X, Y) esté en un rectángulo, empleamos 
el siguiente teorema, generalización del teorema 14.2 b). 



Figura 14.12 Región rectangular infinita Figura 14.13 El suceso «X < b, Y < </» 
A X B, siendo A = {x\x < a} expresado como reunión de cuatro sucesos 
y B = {y|y<6}. disjuntos. 
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teorema 14.10. Si F es la función de distribución de una variable alea- 
toria bidimensional ( X, Y) y si a<b y c<d, entonces 

(14.28) P( a < X <,b, c < Y <, d) = F(b, d) — F(a, d) - F(b, c ) + F(a, c). 

Demostración. Los dos sucesos «X ^ a, c < Y ^ d» y «X ^ a, Y ^ c» son 
disjuntos, y su reunión es «X — a, Y ^ d». Sumando las probabilidades obtenemos 
P(X^a, c<Y^d) + P(x^a, Y ^ c) = P(X ^ a, Y ^ d ); luego, 

P(X<,a,c<Y<,d) = F(a,d)~ F(a, c). 

Análogamente, tenemos: 

P(a < X <,b, Y <,c) = F(b, c) - F(a, c). 


Los cuatro sucesos 

“X<,a, Y<,c,” “X<,a,c<Y<,d,'' 

“a<X<,b,Y<, c ;’ “ a<X<,b,c<Y<,d" 

son disjuntos, y su reunión es «X ^b.Y^ d». (Véase figura 14.13.) Sumando las 
correspondientes probabilidades y en virtud de las dos igualdades precedentes obte- 
nemos: 

F(a, c) + [F(a, d) - F(a, c )] + [F(b, c) - F(a, c)] + 

+ P(a < X <,b,c < Y <,d) = F(b,d), 
que equivale a (14.28). 

La fórmula (14.28) da la probabilidad de que la variable (X, Y) tenga un 
valor interior al rectángulo (a, 6] X (c, d]. Existen, como es natural, las corres- 
pondientes fórmulas para los rectángulos [a, 6] x [c, d], (a, b) X (c, d), 
[ a, b) X [c, d), etc. 


Observación. E1 concepto de masa de probabilidad también puede extenderse al 
caso bidimensional. Aquí la masa total 1 está distribuida sobre el plano. La probabili- 
dad P(a <X<b,c<Y<d) representa la cantidad total de masa situada en el rec- 
tángulo (a,b) x (c,d). E1 número F(a,b ) representa la cantidad en la región rectan- 
gular infinita X < a, Y < b. Como en el caso unidimensional, los dos tipos más 
importantes de distribuciones son las discretas y las continuas. En el caso discreto 
toda la masa está concentrada en un número finito o en una infinidad numerable 
de puntos. En el caso continuo la masa está repartida sobre el plano con un espe- 
sor uniforme o variable. 
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14.20 Distribuciones discretas biditnensionales 

Dada la variable aleatoria ( X, Y) podemos definir una nueva función p, lla- 
mada la función de masa de probabilidad de ( X, Y), tal que 


p(x,y)=P(X=x, Y = y) 


para todo par de números reales (x, y). Sea T el conjunto de puntos (x, y) para 
íos cuales p(x, y) > 0. Puede demostrarse que T es finito o infinito numerable. 
Si la suma de las probabilidades p(x, y) para todo (x, y) de T es igual a 1, esto 
es, si 

(14.29) 2 p(x> y) = 1 • 

(x.vieT 

la variable aleatoria (X, 7) se llama discreta. Los puntos (x, y) de T son puntos 
de masa de (X, 7). 

Supongamos que x lt x 2 , x 3 ,... e yi, y 2 , y 3 ,... son valores posibles de X e Y 
respectivamente, y sea 


Pil = P(X = Xi , Y = y t ). 

Si cada pa es positiva y la suma de todas las py es 1, la probabilidad del suceso 
«(X, Y) 6 E» es la suma de todas las p,-,- considerando todos los Xi e y } para los 
que (xt, yi) e E. Indicamos esto escribiendo 


P[(X,Y)eE]= 2J P{j . 


En particular, puesto que P(X ^ x, Y ^ y) = F(x, y), la distribución conjunta F 
(que también se llama discreta) viene dada por la doble suma 

(14.30) F ( x > y) =2_ x 2 Pu- 

Los números p,,- también pueden usarse para reconstruir las funciones de masa 
de probabilidad px y P y de las variables aleatorias unidimensionales X e Y. En 
efecto, si Eij representa el suceso «X = Xi, Y = y,», los sucesos E i2 , £, :i , . . . 
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son disjuntos y su reunión es el suceso «X = *,•». Luego, por aditividad numera- 
ble, obtenemos 

( 14 - 31 > p(x = xù = ïm ,)=i Ptj. 

Análogamente, obtenemos 

(14.32) P(Y = y,) = |P(E,,) = | Pii . 

Por lo tanto, las correspondientes distribuciones unidimensionales F x y Fy pueden 
calcularse a partir de las fórmulas 

Fx(t) = 2 P(X = Xi ) =2 t Ìpu 

y 

Fr(t) = 2P(Y = yj) = 2 | p i} . 

Vj<* Vj<ti =1 

Para espacios muestrales finitos, naturalmente, las series deben reemplazarse por 
sumas finitas. 

14.21 Distribuciones continuas bidimensionales. Funciones dc densidad 

Como podía suponerse, las distribuciones continuas son las que son continuas 
en todo el plano. Para la mayoría de las distribuciones continuas F que se presen- 
tan en la práctica existe una función no negativa / (que se llama densidad de pro- 
babilidad de F) tal que las probabilidades de la mayor parte de los sucesos que 
nos interesan pueden calcularse por doble integración de la densidad. Esto es, 
la probabilidad de un suceso «(X, V) e Q» es: 

(14-33) P[(X,Y)eQ] = jjf. 

Q 

Cuando tal función / existe se llama también densidad de probabilidad de la varia- 
ble aleatoria (X, 7), o densidad conjunta de X e Y. No intentaremos describir la 
clase de regiones Q para las que (14.33) es válida, tan sólo mencionaremos que 
esta clase es lo bastante amplia para incluir todas las regiones que se presentan 
en las aplicaciones ordinarias de las probabilidades. Por ejemplo, si existe una 
densidad conjunta tenemos siempre 

P(a<X<b,c<Y <d) = jj f(x, y) dx dy, 

R 


(14.34) 
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donde R = [a, /?] X [c, d]. E1 integrando / frecuentemente es tal que la integral 
doble se puede calcular por integración unidimensional repetida en cuyo caso 
(14.34) se transforma en 

P(a < X < b, c < Y < d) = j* [J o V(x, y) dxj dy = jj jjjfix, y) dy\ dx. 


En todos los ejemplos que consideraremos, esta fórmula es también válida en los 
casos límite en los que a y c se sustituyen por — °° y b y d por + °°. Así pues, 
tenemos 


(14.35) F(b, d) = j^ [/_„,/(*, y) dx\ dy = J^ \j_ x f(x, y) dy\ dx 
para todo par b y d, y 

(14.36) J^ [J^ f(x, y) dx\ dy = J ^ [J_^ f(x, y) dy\ dx = 1. 


Las igualdades (14.35) y (14.36) son las correspondientes a las (14.30) y (14.29) 
de los casos discretos, respectivamente. 

Si existe una densidad no es única, ya que el integrando en (14.33) puede 
modificarse en un número finito de puntos sin afectar el valor de la integral. Sin 
embargo, existe a lo más una función de densidad continua. En efecto, en los 
puntos de continuidad de / tenemos las fórmulas 


f(x,y) = D 12 F(x, y) = D ÌA F(x,y), 


obtenidas por derivación de las integrales (14.35). 

Como en el caso discreto, la densidad conjunta / puede usarse para calcular 
las densidades unidimensionales fx y fr. Las fórmulas análogas a las (14.31) y 
(14.32) son 

fx(x) = j_ n f(x, y) dy y f r (y) = J_ + “/( jc, y) dx. 

Las correspondientes distribuciones F x (t) y Fr(t) se obtienen, naturalmente, inte- 
grando las respectivas densidades f x y fy entre - « y t. 

Las variables aleatorias X e Y se llaman independientes si la distribución 
conjunta F(x, y) puede factorizarse como sigue 


F(x,y) = F x (x)F r (y) 
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para todo (x, y). En la próxima sección de ejercicios se discutirán algunas conse- 
cuencias de la independencia. 

ejemplo. Consideremos la función / que tiene el valor constante 1 sobre el 
cuadrado R = [0, 1] X [0, 1], y el valor 0 en el resto del plano. Una variable 
aleatoria ( X, Y) que tenga esta función de densidad se llama distribuida uniforme- 
mente sobre R. La correspondiente función de distribución F es: 


'xy s i (x,j)eR, 

X si 0 < X < 1 y y> 1 , 

F(x,y)=\y si 0 <j< 1 y x>lf 

1 Si X > 1 y y ^ 1, 

0 en los demás puntos. 

La gráfica de F sobre R es una parte de la superficie z = xy (silla de montar). En 
los puntos interiores de R existen las derivadas parciales mixtas D lt2 F(x, y ) y 
D 2i1 F(x, y) y son iguales a f(x, y). Esta distribución es el producto de dos distri- 
buciones uniformes unidimensionales F x y F r . Luego X e Y son independientes. 

14.22 Ejercicios 

1. Sean X e Y dos variables aleatorias unidimensionales con distribuciones F x y F y , y sea 
F la distribución conjunta de X e Y. 

a) Demostrar que X e Y son independientes si, y sólo si, tenemos 


P(a < X < b, c < Y < d) = P(a < X <, b)P(c <Y<,d) 
cualesquiera que sean a, b, c, d, con a < b y c < d. 

b) Consideremos el caso discreto. Supongamos que Xl , Xls ,... e yi,y 2 ... son los puntos 
de masa de X e Y, respectivamente. Sean a f = P(X = Xl ) y b, = P(Y = y ). Si 
todô^ par^i~j Xi * ^ = ^ emosírar <l ue X e Y son indejpendientes si p if = a t b f parr 

c) Supongamos que X e y tienen distribuciones continuas con las densidades f x y f y 
y sea / la densidad de Ia distribución conjunta. Admitamos la continuidad de las tres 
densudades Demostrar que la condición de independencia es equivalente a la afirma- 

r }-P' X ’. y ) -My) Para todo (x,y). (Indicación: Expresar / como derivada de la 
distribución conjunta F.] 

2 ' F(V-t rC, ?- 1 vJ U -°Píx qUe,>( v =X \ Y V Ù= P(X = X2 - y = ^) = P/2 y que 

\ rT. • ~. y2 ) - p ) x -X 2 ,Y = yi ) = q/2, siendo pyçno negativas de suma 1. 

a) Determinar Ias probabilidades unidimensionales P(X = x,) y P(Y = y t ) para i = 1,2 

b) c',Para qué valor (o valores) de p serán independientes X e Y? 
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1 

f{x,y)= (b — a)(d — c) 
0 


si (x,y)e[a,b] x [c,d], 

en cualquier otro caso. 


a) Comprobar que ésta es la densidad de una distribución continua F y determinarla. 

b) Determinar las distribuciones unidimensionales F x y F r . 

c) Determinar si X e Y son o no independientes. 

4. Si P(Y < b) ^ 0, la probabilidad condicionada de que X < a, dado que Y < b, se re- 
presenta con el símbolo P(X < a | Y < b), y se define mediante la igualdad 


P(X <.a\Y <.b) = 


P(X <,a, Y <,b) 
P(Y<,b) 


Si P(Y < b) = 0, definimos P(X < a | Y < b) = P(X < a). Análogamente, si 
P(X < a) * 0, definimos P(Y <,b\X <,a)= P(X <,a,Y <, b)jP(X <, a),S\P(X <. a)= 0, 
definimos P(Y < b \ X < a) = P(Y < 6). 

a) Probar la independencia de X e y y expresarla en función de probabilidades condi- 
cionadas. 

b) Considerar el caso discreto. Supongamos que xi, xo,... e yi, y2,... son Ios puntos 
de masa de X e Y respectivamente. Demostrar que 


P(X = Xi ) = fp(Y= yi )P(X = x { | Y=y,) 
i-i 

y 

P(Y = y t ) =f P(X = x t )P( Y=y t \X = x ( ). 


5. Una casa de juego ofrece a sus clientes el juego siguiente: Se lanza una moneda. Si el 
resultado de la primera tirada es cruz, el jugador pierde y el juego vuelve a empezar. 
Si en cambio sale cara, vuelve a echarse la moneda. Si en la segunda tirada aparece 
cara el jugador gana 2 dólares, pero si sale cruz gana sólo 1 dólar. Sea X la variable 
aleatoria que vale 1 ó 0 según que en la primera tirada aparezca cara o cruz. Sea Y otra 
variable aleatoria que cuenta el número de dólares ganados por el jugador. Hacer uso del 
ejercicio 4 (o de algún otro método) para calcular P(Y = 0), P(Y = 1), y P(Y = 2). 

6. Haciendo referencia al ejercicio 4, deducir la ilamada fórmula de Bayes: 


P(X = x k \Y=y t ) 


P(X = x k )P(Y=y t \X = x k ) 

IA P(X = x t )P( Y=y t \X = x t ) ’ 


P(Y=y k \X = x ( ) 


P(Y = y k )P(X = x ( | Y = y k ) 
IA P(Y = y t )P(X = x ( | Y=y t ) ■ 


7. Dadas dos urnas A y B. La uma A contiene un billete de 5 dólares y dos de 10 dó- 
lares. La urna B contiene tres billetes de 5 dólares y uno de 10 dólares. Se extrae un 
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billete de A y se introduce en B. Sea Y la variable aleatoria que cuenta el valor del 
billete transferido. A continuación se extrae un billete de la uma B y usamos la variable 
aleatoria X para contar su valor. Calcular las probabilidades condicionadas 

P(y = 5|JT = 10) y P(Y= 101 X= 10). 

[Indicación: Hacer uso de la fórmula de Bayes del ejercicio 6.] 

8. Dadas tres cajas idénticas, cada una de las cuales tiene dos departamentos. La caja nú- 
mero 1 tiene una moneda de oro en un departamento y una de plata en el otro. La caja 
2 tiene una moneda de oro en cada departamento y la caja 3 una moneda de plata en 
cada departamento. Se abre al azar un departamento y se encuentra una moneda de 
oro. Calcular la probabilidad de que el otro departamento de la misma caja contenga 
una moneda de plata. [Indicación: Emplear la fórmula de Bayes.] 

9. Sea Q una región plana y a(Q) su área. Se dice que una variable aleatoria bidimen- 
sional (X, Y) tiene distribución uniforme sobre Q si su función de densidad / viene 
definida por las fórmulas: 




jl la(Q) 


si (x,y)GQ, 
si (x,y)$Q. 


a) Si E es una subregión de Q con área a(E), demostrar que a(E)/a(Q) es la pro- 
babilidad del suceso (X, Y) e E. 

b) Caen al azar gotas de agua sobre el cuadrado Q de vértices (1,0), (0,1), (-1,0), 
(0, -1). Un resultado es el punto (x, y) de Q alcanzado por una determinada gota. sèan 
X(x, y) = x e Y(x, y) = y y supongamos que (X, Y) tiene distribución uniforme sobre Q. 
Determinar la función de densidad conjunta / y las densidades unidimensionales f x 
y f Y . iSon independientes las variables X e f? 

10. Una variable aleatoria bidimensional (X,Y) tiene la función de distribución conjunta 
F. Sean U = X - a, V = Y - b, siendo a y b constantes. Si G representa la distribu- 
ción conjunta de (U, V) demostrar que 

G(u, v) = F(u + a, v + b). 

Deducir una relación semejante entre las funciones de densidad / de (X, Y) y g de 
(U, V) cuando / es continua. 


14.23 Distribuciones de funciones de dos variables aleatorias 

Consideremos ahora un problema más general. Si X e Y son variables alea- 
torias unidimensionales con distribuciones conocidas, lcómo encontramos la dis- 
tribución de nuevas variables aleatorias tales como X + Y, XY o X 2 + Y 2 ? E1 
resto de esta seccion se dedica a exponer un método que nos ayuda a contestar 
preguntas como ésta. Definimos dos nuevas variables aleatorias U y V con ecua- 
ciones de la forma 


U= M(X, Y), V=N(X, Y), 
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donde M(X, Y) o N(X, Y) es la combinación particular en la que estamos intere- 
sados. A partir del conocimiento de la distribución conjunta / de la variable alea- 
toria bidimensional ( X , Y) calculamos la distribución conjunta g de (U, V). Una 
vez se conoce g, las distribuciones de U y de V se encuentran fácilmente. 

Para describir el método con detalle, consideremos una aplicación uno a uno 
del plano xy sobre el plano uv definida por el par de ecuaciones 

u = M(x,y), v = N(x,y). 

La aplicación inversa sea la definida por 

x = Q(u, v ), y = R(u, v), 

y supongamos que Q y R tienen derivadas parciales continuas. Si T es una región 
en el plano xy, sea T' su imagen en el plano uv, como se ve en la figura 14.14. 
Sean X e Y dos variables aleatorias unidimensionales continuas que tengan una 
distribución conjunta continua y sea / la función de densidad de probabilidad de 
(X, Y). Definamos las nuevas variables aleatorias U y V escribiendo U=M(X, Y), 
V = N(X, Y). Para determinar la densidad g de la variable aleatoria (U, V) pro- 
cedemos como sigue: 

Las variables aleatorias X e Y están asociadas a un espacio muestral S. Para 
cada «d e S tenemos í/(o>) = M[X(«), Y(«)], y V(«0 = N[(*), Y(«)]. Puesto que 
la aplicación es uno a uno, los dos conjuntos 


{10 | (U(<o), V(co)) e T'} y {co | (X(o>), Y(co)) e T} 
son iguales. Por consiguiente, 

(14.37) P[(U, V) e T'] = P[(X, Y)eT}. 

Ya que / es la función de densidad (X, Y) podemos escribir 

(14.38) p[( x > y) e T i = fí /(*. y ) dx d y ■ 

T 

En virtud de (14.37) y de la fórmula de transformación de las integrales dobles la 
(14.38) se convierte en: 

P[(U, Y) e T'] = ff f[Q(u, v), R(u, «0] I I dudv. 

JJ I d(u, v) I 




Figura 14.14 Aplicación uno a uno de una región T del plano xy sobre una región 
T' del plano uv. 


Ya que esto es válido para toda región V del plano uv la densidad g de (U, V) 
está definida por el integrando del segundo miembro; esto es, tenemos: 

( 14 - 39 ) g(«, v ) = f[Q(u, v), R(u, a)] I I. 

I d(u,v) I 

Las densidades f v y f v pueden ahora obtenerse por las fórmulas 


fu(u) = j_ x g(u, v) dv, f r (v) = J_ w g( u , v) du. 

ejemplo 1. Suma y diferencia de dos variables aleatorias. Dadas dos varia- 
bles aleatorias unidimensionales X e Y con densidad conjunta f, determinar las 
funciones de densidad para las variables aleatorias U = X + YyV = X — Y. 


Solución. Utilicemos la aplicación dada por u = x + y, v = x — y. Esta 
es una transformación lineal no singular cuya inversa viene dada por 

x = G(«,»), y = 'f— = R(u, v). 


dQ 3Q 


1 1 

du dv 


2 2 

dR dR 


1 1 

du dv 


2 2 


E1 jacobiano es 
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Aplicando la ecuación (14.39) vemos que una densidad conjunta g de (U, V) viene 
dada por la fórmula 


g(u,v) = f^-^ 


u - v\ I d(Q, R) l (u + v u-v \ 

2 ) | d(u,v) 2 J \ 2 ’ 2 / 


Para obtener una densidad fu = fx+r integramos respecto a v y encontramos 


fx+r(u) = ~ 2 




dv. 


E1 cambio de variable x = y 2 (u + v), dx = y 2 dv, transforma esa fórmula en la 
siguiente: 

fx+r(u) = S_ x f( x > u — x)dx. 

Del mismo modo, encontramos 

fx-r(v) = ~ 2 J^/ (“ du = x ~ v ) dx - 


Un caso particular importante se presenta cuando X e Y son independientes. 
En este caso la densidad de probabilidad conjunta se escinde en un producto 


f(x,y) =fx( x )fr(y)> 

y las integrales que dan fx+y y fx-Y se convierten en 

fx+r( u ) = fx( x )fr(u -x)dx, f X -r( v ) = /_„ fx( x )fr( x -v)dx. 


ejemplo 2. Suma de dos distribuciones exponenciales. Supongamos ahora 
que cada una de las variables X eY tiene una distribución exponencial, por ejem- 
plo fx(t) = f Y (t) = 0 para t < 0, y 

f x (t) = 2e~ u , f r (t) = pe-»* para t ^ 0. 


Determinar la densidad de X + Y cuando X e Y son independientes. 


Solución. Si u < 0 la integral que da fx+y(u) es 0 ya que el factor f x (x) = 0 
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para x < 0, y el factor f Y (u — x) = 0 para x ^ 0. Si u 2: 0 la integral que da 
fx+r(u) se transforma en 


f x+y(m) = J Q Xx pe Mu x) dx = Xpé~ uu J* é 


Para calcular la última integral consideremos dos casos, p. — A. y p \. 
Si p. = A la integral tiene el valor u y obtenemos 


Si 


, u fx+r(u) = ?ue- Xu 

~r~ \ obtenemos 


para u>0. 


fx+r(u) = lpe~» u * U 7 1 = Xp e -— 

H - A fA - X 


para u > 0. 


ejemplo 3. Máximo y mínimo de dos variables aleatorias independientes. 
Sean X e Y dos variables aleatorias unidimensionales con densidades f x y f Y y 
funciones de distribución correspondientes F x y F r . Sean U y V las variables alea- 
torias 


U = max {X, Y}, V = min {X, Y}. 

Esto es, para cada <o en el espacio muestral, U(o>) es el máximo y V(u>) el mínimo de 
los dos números X(o»), Y(»). La aplicación u = max {x, y}, v = min {x, y} no 
es uno a uno, así que el método utilizado para deducir la ecuación (14.39) no es 
aplicable. Sin embargo, en este caso podemos obtener las funciones de distribu- 
ción de U y V directamente. 

Observemos primero que U ^ t si, y sólo si, X ^ t e Y=< t. Por consiguiente 
P(U — t) = P(X — t, Y ^ t). En virtud de la independencia esto es igual a 
P(X ^ t)P(Y ^ t) = F x (t)F r (t). Así pues, tenemos 

Fu(t) = F x (t)F Y (t). 

En cada punto de continuidad de f x y f Y podemos derivar esa relación obteniendo 
fu(t) =fx(t)F Y (t) + F x (t)f Y (t). 

Del mismo modo, tenemos V > t si y sólo si X > t e Y > t. Por consiguiente 
F v(t) = P(V < 0=1 -P(V>t)= 1 -P(X> t, Y>t)= 1 - P(X > t)P(Y > t) 
= 1 — (1 — Fx(t))(l - Fy(t)) = F x (t) + Fy(t) - F x (t)F r (t). 
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En los puntos de continuidad de fx y fr derivamos esa relación y obtenemos 

f V (t) =f X {t) +fr(t) -f X (t)Fy(t) - F x (t)fy(t). 


14.24 Ejercicios 

1. Sean X e Y dos variables aleatorias unidimensionales independientes, con distribución 
uniforme cada una sobre el intervalo [0,1]. Sean U = X + Y y V = X — Y. 

a) Demostrar que U tiene una densidad continua f v dada por 

si 0 < u <, 1, 
si 1 <u <2, 
para los demás valores de u 


fu(u) - 


b) Describir, en forma análoga, una densidad continua fv para V. 

c) Determinar si U y V son o no independientes. 

2. Sean X e Y las del ejercicio 1, y U = max{X, y}, V = min{X, 7}. 

a) Demostrar que U tiene una función de densidad tal que /«(<) = 2 1 para 0 < t <1, 
y fuU) = 0 para los demás valores de t. 

b) Describir una función de densidad fv para V. 

c) Determinar si U y V son o no independientes. 

3. Sean X e Y dos variables aleatorias unidimensionales independientes, cada una con 
distribución exponencial con parámetro X = 1, y sea f(x, y) = f x (x)f r (y), el producto 
de las densidades de X e Y. 

a) Sea A el conjunto de puntos del plano xy en los que f(x, y) > 0. Dibujar A y su 
imagen A' en la aplicación definida por u = x + y, v = x/(x + y). 

b) Sean U = X + Y y V = X/(X + Y) dos nuevas variables aleatorias. Calcular Ia 
densidad g de (U, V). 

c) Calcular la densidad f v . 

d) Calcular la densidad f v . 

4. Sean X e Y dos variables aleatorias independientes, ambas con distribución normal ca- 
nónica (media = 0, varianza = 1). Introduzcamos las nuevas variables aleatorias U y V 
mediante las ecuaciones U = X/Y, V = Y. Sea g la función densidad de (U,V). 

a) Demostrar que 


g(u, v) = - e (1 +“ 2) “ 2/2 si v < 0. 


b) Encontrar una fórmula parecida para calcular g(u, v) cuando v > 0. 

c) Determinar la función densidad de U. 
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5. Supongamos que X tenga la función densidad dada por 


fxM = 



si -1 < X < l, 
« 1*1 £ 1 . 


Si una variable aleatoria independiente Y tiene la densidad 


fr<y) = 


y-v*/* 

o 


y 

y 


£ 0 , 

<o. 


encontrar la densidad de Z = XY. 

6. Dadas dos variables aleatorias unidimensionales independientes X e Y con densidades 
continuas f x y f r . Sean U y V dos variables aleatorias taies que X = U cos V, 
Y = U sen V, siendo U > 0 y — tr <V <ir. 

a) Demostrar que U tiene una función de densidad tal que fv(u) = 0 para u < 0 y 


fu(u) = U f x (u COS V)fy(u sen v) dv 


para u ^ 0. 


b) Determinar f v y la correspondiente distribución F v explícitamente cuando cada una 
de las variables X e Y tiene una distribución normal con media m = 0 y varianza a 2 . 

7. a) Suponiendo a\ > 0 y 05 > 0, comprobar la identidad algebraica 


m ' J + ^ ~ * ~ m 2 j _ | * ~ m„ J + ^ / - ( mi + m 2 ) j' 

_ /»i g 2 + (/ - mf)a\ 


= a\ + a 2 , a J , 


b) Dadas dos variables aleatorias unidimensionales independientes X e Y. Supóngase 
que X tiene una distribución normal con media m\ y varianza a \, y que Y tiene una 
distribución normal con media m 2 y varianza a\. Demostrar que X + Y tiene una dis- 
tribución normal con media m = mi + m 2 y varianza a 2 = a\ + a\. 

8. Dadas dos variables aleatorias unidimensionales X e Y con densidades f x y f r y den- 
sidad conjunta /. Para cada y fijo, se define 

fx(x | Y = y) = siempre que f r (ý) > 0. 

Esta es la llamada densidad de probabilidad condicional de X, supuesto que Y — y. 
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Análogamente, defìnimos la densidad de probabilidad condicional de Y, en el supuesto 
de que X = x, mediante la ecuación 

f(XyV) 

f Y (y\X = x) = siempre que f x (x) > 0 . 

a) Si f r y fx son positivas, demostrar que (™ a:i f x (x | Y = y) dx = fy(y\X = x) 
dy = l. 

b) Si f r y fx son positivas, demoslrar que 

/iW = j*JrWx(.x\Y=y)dy y fr(y) = j™/x(x)f Y (y \x = x )dx. 

9 . Una variable aleatoria (X, Y) tiene distribución normal bivariada si su densidad es 
f(x,y) = 

siendo 


Q(x,y) = A n (x - xff + 2A l2 (x - Ar 0 )(y - y 0 ) + A 22 (y - y 0 ) s . 

Q se llama «forma cuadrática». Los números A n , Ar>, A22 son constantes y A11 > 0. 
E1 número D = A11A22 — +12 se llama discriminante de <3 y se supone positivo. Los 
números *o e yo son cualesquiera. 

a) Demostrar que Q(x, y) puede reducirse a la suma de cuadrados siguiente: 

/ +2 \ 2 D , 

Q(x,y) = A n lu + Â^°) + Â^ V ’ siendo u =x-x 0 ,v =y - y 0 . 

+ 00 

b) Deftnir la integral doble impropia JJ f(x, y) dx dy como el límite: 


jjf(x,y)dxdy = lim jjf(x,y)dxdy, 

-00 ‘“* +0 ° K(í) 

en donde R(t) es el cuadrado [—/,(] X [—/,/]. Demostrar que 


JJ f(x,y)dxdy = 1. 


[Indicación: Utilizar el apartado a) para transformar Ia integral doble sobre 
R(t) en otra sobre el plano uv. Efectuar entonces una transformación lineal de va- 
riables para simplificar la integral y, por último, hacer tender / a + = .] 
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10. Si una variable aleatoria bidimensional (X, V) tienc distribución normal bívariada eomo 
se ha dicho en el ejercicio 9, demostrar que X e Y son asimismo variables aleatorias 
umdimensionales normales con medias x u e y» respcctivamente, y con varianzas 
aHX) = A22/D, <r-(Y) = An/D. 

11. Si (X,Y) tiene distribución normal bivariada, demostrar que la variable alcatoria 
2 = X + Y tiene distribución normal unidimensional con mcdia + y„ y varianza 
(/In - 2/4(2 + A > <)/D. 


14.25 Esperanza y varianza 

La interpretación como masa de las distribuciones de probabilidad puede 
llevarse a un estadio más avanzado introduciendo los conceptos de esperanza y de 
varianza. Juegan éstos, en Cálculo de probabilidades, el mismo papel que el «cen- 
tro de gravedad» y el «momento de inercia» en Mecánica. Sin utilizar la integral 
de Stieltjes hay que dar separadamente las definiciones para los casos discreto y 
continuo. 

definiciones de esperanza y varianza. Sea X una variable aleatoria unidi- 
mensional. La esperanza de X y la varianza de X son números reales que se desig- 
nan con E(X) y Var(X) respectivamente, y se definen como sigue: 

a) Para una variable aleatoria continua con densidad fx, 

E(X) = $+: t/x(0 dt, 

Var (X) = /_ + J [í - E(X)ff x (t) dt. 

b) Para una variable aleatoria discreta con puntos de masa Xi, x 2 ,... y 
probabilidades Pk = P(X = Xk), definimos: 

E(X) =ïx kPk , 

Va r(X)=t[x*-.E(X)]V 


Observación. E(X) y Var(X) existen únicamente cuando la integral o la serie en 
cuestión es absolutamente convergente. Se sobreentiende que la serie es una suma 
finita cuando el espacio muestral es finito; en tal caso £(X) y Var(X) existen siem- 
pre. También existen cuando f x es 0 en el exterior de algún intervalo finito. 

La esperanza matemática E(X) es un valor calculado teóricamente asociado 
a la variable aleatoria X. En cierta forma, la distribución actúa como si toda la 
masa estuviera concentrada en un solo punto, E(X). La significación precisa de la 
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esperanza matemática en la teoría de las probabilidades se discutirá en la sec- 
ción 14.29 en conexión con la llamada «ley de los grandes números». 

En Mecánica, el solo conocimiento del centro de gravedad no nos indica la 
forma en que la masa está extendida o dispersa en torno a su centro. E1 «segundo 
momento» o «momento de inercia» nos da una medida de esa dispersión. En pro- 
babilidades, este segundo momento es la varianza. En la sección 14.28 veremos 
que una varianza pequena indica que son improbables las desviaciones grandes 
respecto a los valores esperados. 

Si bien la esperanza matemática E(X) puede ser positiva o negativa, la 
varianza Var(X) siempre es no negativa. También se utiíiza el símbolo a 2 para 
representar la varianza. Su raíz cuadrada positiva se llama la desviacióntípica y se 
representa por a. La desviación típica es un promedio ponderado; en realidad, 
a es la media cuadrática ponderada de la distancia de cada valor de X al valor 
de E(X). En Mecánica, el concepto análogo es el «radio de giro». 

ejemplo 1. Distribución uniforme. Supongamos que X tenga una distribu- 
ción uniforme sobre un intervalo [a, b]. Entonces f(t) — 1 /(b — a) si a < t< b, 
y f(t) — 0 para los demás valores de t. Por consiguiente, la esperanza de X es: 


->=r— 


a±b 
2 ’ 


que es el punto medio del intervalo. Si ponemos m en lugar de (a + b)/2 y obser- 
vamos que m — a — b — m = (b — a)/2 encontramos: 


Va, (X) - ± a f (' - »)’ - ±- a »*«'« - 


Observemos que la varianza tan sólo depende de la longitud del intervalo. 

ejemplo 2. Distribución binomial. Si X tiene distribución binomial con 
parámetros n y p tenemos: 


-2 

*=0 x ' 


siendo q = 1 — p. Para calcular esta suma, sea 
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y teniendo en cuenta que 




Si multiplicamos ambos miembros de esta última ecuación por * y ponemos x = d 
e y = q, obtenemos E(X) = np. F 

Mediante un argumento similar podemos deducir la fórmula 


Var ( x ) ~ n P?(ji)p k( l n *— n P9- 

En el ejercicio 6 de la sección 14.27 se pide la demostración de esta fórmula. 

ejemplo 3. Distribución normal. Las palabras «media» y «varianza» ya 
íueron tntroducidas al describir la distribución nqrmal en la sección 14.14. Tales 
denominaciones se justifican mediante las fórmulas 


y 

Var (X) = -j= J +0 ° ( t - m ) 2 e-U‘- m>MÌ/2 dt = ff 2 . 

En el ejercicio 7 de la sección 14.27 se piden las demostraciones de esas fórmulas. 

Los jugadores emplean con frecuencia el concepto de esperanza para decidir 
si un determinado juego de azar es favorable o desfavorable. Como ejemplo vamos 
a considerar el juego de apostar sobre el «rojo» o el «negro» en la ruleta. 


ejemplo 4. Ruleta. Una ruleta recorre los números del 0 al 36. E1 0 aparece 
sobre el fondo gris, la mitad de los 36 números restantes sobre fondo rojo y la 
otra mitad sobre fondo negro. Los métodos corrientes de apuestas son: 

1) Apostar 1 $ sobre un color (rojo o negro). Ganancia posible: 2 $. 

2) Apostar 1 $ a un solo número (excluido el 0). Ganancia posible: 36 $. 

3) Apostar 1 $ a una docena cualquiera de números (0 excluido). Ganan- 
cia posible: 3 $. 

Si sale el 0 la casa gana y todos los demás jugadores pierden. 

Sea X la variable aleatoria que mide la ganancia que se consigue apostando 
c°n d metodo 1). Los posibles valores de X son x* = — 1 y x 2 = + 1. Las pro- 
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babilidades son P(X = *i) = 19/37, P(X = x 2 ) = 18/37. Por lo tanto, la espe- 
ranza es 


E(X) = (-Ì)lf + (+Dif = -âV; 

este resultado se interpreta corrientemente como que el juego es desfavorable para 
todo el que participa en él. La justificación matemática de esta interpretación se 
consigue con una de las leyes de los grandes números, que se discuten en la sec- 
ción 14.29. E1 lector puede comprobar que la esperanza tiene el mismo valor 
usando los métodos de apuesta 2) y 3). 

ejemplo 6. Un juego de cara y cruz. En un juego de cara y cruz hay una 
probabilidad p de que salga cara (H) y una probabilidad q de que salga cruz (T), 
siendo O^p^l y q = 1 — p. Se íanza la moneda sucesivamente hasta que 
vuelva a aparecer por segunda vez el primer resultado que se obtuvo; entonces 
termina el juego. Si el primer resultado es H el jugador gana 1 $ por cada T que 
salga hasta que volvamos a obtener H. Por ejemplo, si HTTTH gana 3 $, en cam- 
bio, si HH gana 0 $. Si el primer resultado es T se aplica la misma regla de juego 
cambiando H por T. E1 problema consiste en determinar cuánto debería pagar un 
jugador para participar en este juego. A tal fin consideramos la variable aleatoria 
que cuenta el número de dólares ganados por el jugador y calcularemos su espe- 
ranza. 

Como espacio muestral tomamos la colección de todas las posibles partidas 
que pueden jugarse. Tal conjunto puede expresarse como la reunión de dos con- 
juntos A y B, donde 


A = {TT, THT, THHT, THHHT, ...} y B = {HH, HTH, HTTH, HTTTH ,.. .}. 

Los elementos del conjunto A (en el orden citado) los designamos por a 0 , a u a 2 ,... 
y los del conjunto B por b 0 , b ly b 2 ,... Seguidamente asignamos las probabilida- 
des, como sigue: 


P(a„)=p n q 2 y P(b n ) = q n p 2 . 

(Cuando p = 0, ponemos P(a 0 ) = 1 y P(x) = 0 para cualquier otro x de A V B. 
Cuando q = 0, ponemos P(b 0 ) = 1 y P(x) = 0 para todos los demás x.) En la sec- 
ción 13.21 se demostró que esta asignación de probabilidades es aceptable. 

La variable aleatoria X que nos interesa se define sobre el espacio muestral 
A V B como sigue: 


X(a n ) = X(b n ) = 


para n = 0, 1, 2,- 
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E1 suceso «X = n» consta de las dos partidas a„ y b„, así que tenemos, 


P(X = n) = p"q 2 + q n p+ 

donde p° y q° se consideran 1 cuando p = 0 o q = 0. La esperanza de X viene 
dada por la suma 

(14.40) E(X) = | nP(X = n) = q 2 ^np n + p 2 J,nq n . 


Si p = 0 o q = 0, obtenemos E(X) = 0. En los demás casos podemos calcular las 
sumas de las series (14.40) observando que para 0 < x < 1 tenemos, 


% x '‘ = x T% n = *-(—) _ 

Zl dx Z?o dx\l-xj (l-x) 2 


Aplicando este resultado en (14.40) haciendo x = p y x = q obtenemos, para 

0 < p < 1, 


E(X) = —— + _É 
(1 - pf ^ (1 - 


Interpretamos este resultado diciendo que el juego es desfavorable para los que 
pagan más de 1 $ para participar en él. 

Este ejemplo tiene especial interés porque la esperanza E(X) es independiente 
de p cuando 0 < p < 1. En otros términos, «cargando» la moneda a favor de cara 
o cruz no se altera el valor esperado salvo en el caso extremo en el que se 
haya «cargado» la moneda de tal modo que nunca salga cara o que nunca salga 
cruz. Nótese que, como función de p, la esperanza E(X) es discontinua en los 
Puntos P = 0 y p = 1. En los demás tiene el valor constante 1. Este interesante 
ejemplo fue sugerido al autor por H. S. Zuckerman. 

14.26 Esperanza de una función de una variable aleatoria 

Si se relaciona una nueva variable aleatoria Y a la X mediante una ecuación 
de la forma Y = q (X), su esperanza (en el caso continuo) viene dada por 


(14.41) E(Y) = £“tf r (t) dt. 


La esperanza E(Y) puede calcularse directamente en función de la densidad f x sii 
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tener que determinar la densidad de Y. Efecdvamente, la siguiente fórmula es 
equivalente a (14.41): 


(14.42) E(Y ) = £” i,{t)f x (t) dt . 

La demostración de (14.42) en el caso más general es difícil y no la intentaremos 
aquí. No obstante, la demostración para muchos casos particulares interesantes es 
sencilla. En éstos, q> es derivable y estrictamente creciente sobrc todo cl cje 
real. Para una variable aleatoria de distribución continua X con densidad f x tene- 
mos la fórmula siguicnte .para la densidad j Y (deducida en la sección 14 . 17 ): 

frO) =fxlv>0)ì' V>'(0> 

siendo ý la inversa de q>. Si aplicamos esto en (14.41) y efectuamos el cambio de 
variable u = f(t) [de modo que t =ç>(«)], obtenemos 

E(Y) = J_ n tf Y (t) dt = j_^ tf x [ip(t)] • \p'(t) dt = j_^ q(u)f x (u) du , 
que coincide con (14.42). 

Cuando la igualdad (14.42) se aplica a Y = (X - mf, siendo m = E(X), 
obtenemos 

E ( Y ) = J_ n (t - mff x (t)dt = Var(*). 

Esto demuestra que la varianza es a su vez una esperanza. También en el caso 
discreto es válida una fórmula análoga a la (14.42). Con mayor generalidad, puede 
demostrarse que 

E[<p(X, 7)] = j_^ j_^ <p(x, y)f(x, y) dx dy 

si (X, Y) es una variable aleatoria continua con densidad conjunta /. 

Observación. Para las variables aleatorias bidimensionales, la esperanza y la 
varianza pueden definirse en forma análoga a la empleada en el caso unidimensional, 
salvo que se emplean integrales y sumas dobles. 


14.27 Ejercicios 


1. Se lanza un dado. Representemos con X el número de puntos conseguido. Calcular 
E(X) y Var(X). 

2. Supongamos que X es una variable aleatoria continua con una cierta función de densi- 
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dad. Sea Y = (X - m)/o, donde m = E(X) y o = ^Var (Jf). Demostrar que E(Y) = 0 
y E(Y°-) = 1. 

3. Deducir las siguientes propiedades generales de la esperanza y de la varianza para los 
casos tanto discretos como continuos. 

a) E(cX) = cE(X), donde c es una constante 

b) Var (cX) = c 2 Var (X) , donde c es una constante 

c) E(X + Y) =E(X) + E(Y). 

d) Var (X) = E(X 2 ) - (E(X)f. 

e) Var (X + Y) = Var (X) + Var ( Y) + 2E((X - E(X))( Y — E( K))]. 

f) E(<p k (X) + <p 2 (Y)] = E(<Px(X)] + E(<p 2 (Y)]. [E1 apartado c) es un caso particular.] 

4. Si X e V son variables aleatorias independientes, demostrar que 

a) Var (X + Y) = Var (*) + Var (r). 

b) E(<p(X) ■ <p(Y)] = E(<p(X)] ■ E(y(Y)]. 

c) Si Xi, Xî, ...,X„ son variables aleatorias independientes con E(X k ) = m k , demos- 
trar que 

Var (X k - m*)J = Ì>ar (X k - m k ) = JjVar (X k ). 

5. Sean Xi, X2 ,... ,X„ n variables aleatorias independientes, con esperanzas iguales, 
E(X k ) = m. y la misma varianza, Var (X k ) = <r 2 . Sea X la media aritmética, X = 
= (l/«)2f=i Xi. Aplicar los ejercicios 3 y 4 para demostrar que E(X) = m y 
Var (X) = <r 2 /n. 

6. a) Si q = 1 — p, demostrar la fórmula, 

2 (* “ 


probando así que Var (X) = npq para una variable aleatoria X que tenga distribución 
binomial con parámetros n y p. (Indicación: k- = k(k — 1) + k.] 

b) Si X tiene distribución binomial con parámetros n y p, demostrar que puede expre- 
sarse como suma de n variables aleatorias independìentes Xi, X2,..., X„, tomando cada 
una los valores posibles 0 y 1 con probabilidades p y q respectivamente, y con dis- 
tribución binomial. Utilizar este resultado y el ejercicio 5 para demostrar que E(X) = np 
y Var (X) = npq. 

7. Determinar la esperanza y la varianza (cuando existan) para una variable aleatoria X 
que tenga 

a) distribución de Poisson con parámetro \. 

b) distribución de Cauchy. 

c) distribución exponencial con parámetro \. 

d) distribución normal. 

8. Una variable aleatoria X tiene una función densidad dada por 


f(t) = ~ si |/| > 1, /(0=0 si UI<1, 
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siendo r > 1 y C(r) es independiente de t. 

a) Expresar C(r) en función de r y hacer un diseho para indicar la naturaleza de la 
gráfìca de /. 

b) Determinar la correspondiente función de distribución F x e indicar la naturaleza 
de su gráfica. 

c) Calcular P(X < 5) y P(5 < X < 10) en función de r. 

d) cPara qué valores de r tiene X una esperanza fìnita? Calcular E(X) en función de r 
cuando sea finita. 

e) cPara qué valores de r tiene X varianza finita? Calcularla en función de r cuando 
sea finita. 

9. Un jugador de ruleta lo hace de acuerdo con el siguiente «sistema». Juega en series 
de tres tiradas. En la primera y segunda tiradas apuesta siempre 1 $ en rojo. Para Ia 
tercera tirada procede así: 

a) Si ganó en la primera y en la segunda, no apuesta. 

b) Si ganó en la primera o en la segunda perdiendo en la otra, apuesta 1 $ en color 
opuesto al que ha salido en la segunda tirada. 

c) Si perdió en las dos primeras, apuesta 3 $ al rojo. 

Sean X, Y y Z los resultados (en dólares) de la primera, segunda y tercera tiradas res- 
pectivamente. Calcular E(X), E(Y), E(Z) y E(X + Y + Z). 

10. (Problema de Petersburgo). Un jugador lanza una moneda y gana 1 $ si a la primera 

tirada sale cara. Si otra vez sale cara gana otro dólar. Si vuelve a salir cara en la ter- 

cera tirada gana 2 $ (en total ha ganado 4 $). Si obtiene una sucesión de n caras con- 

secutivas su ganancia acumulada es de 2"~' dólares. EI juego termina cuando sale cruz. 
Sea X el número de dólares ganados en una determinada lirada. Calcular E(X). Visto el 
resultado, icuánto ha de pagar un jugador a una casa de juego para poder tomar parte 
en un juego con las reglas anteriores? 

11. a) Supongamos que X es una variable aleatoria continua con densidad f x . Sea 

Y = (X- m)/o, donde m = E(X) y o = V Var(X). Demostrar que 


E(e Y ) = e- m '° [_ + “ e t,a f x (t) dt. 


b) Sea X una variable aleatoria discreta con distribución de Poisson de parámetro 
Definir Y como en la parte a) y demostrar que 

E(e Y ) = e~ xa{x ' , donde G(2) = 1 + —_ - e i / v 1l. 

V* 

12. Una variable aleatoria X t iene distri bución normal canónica. Calcular: a) E( X ), 
b) E(e x ), c) Varle*), d) E(V X- + Y' 2 ). En la parte d), Y también tiene distribución 
normal canónica, pero es independiente de X. 


14.28 Desigualdad de Chebyshev 

Como ya se mencionó, un valor pequeno de la varianza significa que es poco 
probable que una variable aleatoria X se desvíe mucho del valor esperado. Para 
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precisar más esta afirmación introducimos el valor absoluto |X — £(X)| que mide 
la distancia entre X y £(X). ^Qué probabilidad hay de que esa distancia supere 
a un determinado número? Para contestar esta pregunta tenemos que determinar 
la probabilidad 


P[\X — E(X)\ > c\, 

donde c es un número positivo dado. En el caso continuo tenemos 
P[\X - E(X)| > c] = 1 - P[\X - E(X) | < c] = 1 - P[E(X) -c<X< E(X) + c] 

r +oo fE(X)+c 

= J^/a-ÍO dí- ) mxì _Jx(t)dt 

(14.43) = C’-V.ÍO dt + j* m+e /x(0 dt ; 

por consiguiente, el cálculo de esa probabilidad puede llevarse a efecto tan pronto 
se conozca la densidad /*. Naturalmente, si fx es incógnita este método no nos da 
información alguna. No obstante, si la varianza se conoce, podemos obtener una 
cota superior en (14.43). Tal cota superior nos la proporciona el siguiente teorema 
de P. L. Chebyshev (1821-1894), famoso matemático ruso que aportó notables 
contribuciones al Cálculo de probabilidades y a otras ramas de la Matemática, en 
especial a la Teoría de números. 

teorema 14.11. desigualdad de chebyshev. Si X es una variable alea- 
toria unidimensional con esperanza finita E(X) y con varianza Var(X), entonces 
para todo número positivo c tenemos 

(14.44) P[|X — £(X)| > c] < 

Demostración. En el caso continuo tenemos: 

Var (X) = J_ + " [í - E(X)]*fx(t) dt 

> j^ XÌ ~ C [í “ E(X)Ŷf x (t) dt + J + ” )+c [f - E(X)ff x (t) dt 

> c 2 (j_y ,_ Vx(o dt+ j + ; )+e /x( o dí). 

En virtud de (14.43), el coeficiente de c 2 en el segundo miembro es 
P[jX—E(X)|>c]. Por consiguiente, dividiendo por c 2 obtenemos (14.44). E1 caso 
discreto puede tratarse en forma semejante. 
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La desigualdad de Chebyshev nos dice que cuanto mayor sea c tanto menor 
será la probabilidad de que |X — £(X)| > c. Dicho de otro modo, no es probable 
que Xsedesvie mucho del valor £(X); lo mismo ocurre si la varianza Var(X) es 
pequena. 

Si reemplazarnos c por ko, siendofc >0y» representa la desviación típica 
[<r = V Var(X)], la desiguadad de Chebyshev se convierte en 

P[\X - £(X)| > ko] < 

k 

Esto es, la probabilidad de que X difiera de su valor esperado más de k veces la 
desviación típica no excede de 1 /k 2 . Por ejemplo, cuando k = 10 esa desigualdad 
nos dice que la probabilidad P[|X — £(X)| > 10<r] no excede a 0,010. Es decir, 
la probabilidad de que un valor observado de X difiera del valor esperado en más 
de 10 veces la desviación típica, no supera a 0,010. Análogamente, cuando k = 3 
encontramos que la probabilidad de que un valor observado difiera de la media en 
más de tres veces la desviación típica, no supera a 0,111. 

La desigualdad de Chebyshev es un teorema general que se aplica a todas 
las distribuciones. En muchas aplicaciones, cuando se tiene más información acerca 
de la distribución que se considera, se puede mejorar esa desigualdad. Por ejemplo, 
si X tiene distribución binomial con parámetros n y p se puede demostrar (utili- 
zando la aproximación normal de la distribución binomial) que para valores gran- 
des de n la probabilidad de que un valor observado difiera de la medida en más 
de tres desviaciones típicas es próxima a 0,003. (Para este resultado, basta n ^ 12.) 
Esta probabilidad es mucho más pequena que la 0,111 conseguida con la desigual- 
dad de Chebyshev. 

ejemplo. Comprobación de una moneda. Deseamos comprobar si una mone- 
da es «correcta» o no, lanzándola 10 000 veces y registrando el número de caras. 
Para una moneda «correcta» la variable aleatoria X que cuenta el número de caras 
tiene distribución binomial con parámetros n = 10 000 y p = La media de 
X es np = 5 000 y la desviación típica es <j = V npq = 50.(Véase el ejemplo 2 
en la sección 14.25). Como antes se dijo, la probabilidad para que una variable 
aleatoria con distribución binomial difìera del valor esperado en más de 3o- es apro- 
ximadamente 0,003. Por lo tanto, convendremos en decir que una moneda «no es 
correcta» si el número de caras en 10 000 tiradas difiere de la media en más de 3 <j. 
Puesto que £(X) = 5 000 y 3o = 150, podríamos afirmar que la moneda «no es 
correcta» si el número de caras en 10 000 tiradas es menor que 4 850 o mayor 
que 5 150. 

14.29 Leyes de los grandes números 


A1 hablar de problemas de monedas, se dice a menudo que la probabilidad de 
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que salga cara con una moneda perfectamente equilibrada es x / 2 . Esto no significa 
que si una moneda se lance dos veces salga necesariamente cara una sola vez. 
Ni que en 1 000 tiradas salgan exactamente 500 caras. Representemos con h(n) 
el número de caras que se presentan en n tiradas. La experiencia nos demuestra 
que incluso para n muy grande, la razón h(n)/n no es necesariamente y 2 . No obs- 
tante, la misma experiencia nos dice que esa razón parece aproximarse a l / 2 cuando 
n crece, si bien puede oscilar considerablemente en torno a \ 2 durante el proceso. 
Esto nos sugiere la posibilidad de demostrar que 

(14.45) lim Ml) = í. 

»-*oo n 2 

Desgraciadamente, esto no es posible. Una de las dificultades es que el número 
h(n) depende no tan sólo de n, sino también de la ejecución del experimento. No 
tenemos medio de conocer de antemano cómo varía h(n) de un experimento a otro. 
Pero la dificultad real es que es posible (aunque no muy probable) que en alguna 
determinada experiencia la razón h(ri)/n no tienda a y 2 en absoluto. Por ejemplo, 
no hay razón para excluir la posibilidad de que salga cara en todas las tiradas de 
la moneda, en cuyo caso h(n) = n y h(ri)/n -> 1. Por consiguiente, en lugar de 
intentar la demostración de la fórmula (14.45), encontraremos más razonable (y 
más útil) averiguar la probabilidad de que h(ri)/n difiera de V 2 en una cierta can- 
tidad. Dicho de otro modo, dado un cierto número positivo c, determinar la pro- 
babilidad 


4 h -f-íH- 

Introduciendo una conveniente variable aleatoria y aplicando la desigualdad de 
Chebyshev podemos conseguir una cota superior útil de esa probabilidad, una cota 
que no exige un conocimiento explícito de h(n). Esto nos lleva a un nuevo límite 
que reemplazará en forma adecuada al (14.45). 

No exige gran esfuerzo tratar el caso más general de una sucesión de pruebas 
de Bemoulli, en la que la probabilidad de «éxito» o «suceso favorable» sea p y 
la de «fallo» o «suceso contrario» sea q. (En el lanzamiento de la moneda, el 
«éxito» será por ejemplo «cara» y tomamos p = %.) Sea X la variable aleatoria 
que cuenta el número de sucesos favorables en n pruebas independientes. En tal 
caso X tiene distribución binomial con esperanza E(X) — npy varianza Var(X) = 
= npq. Luego la desigualdad de Chebyshev es aplicable; ella nos dice que 

(14.46) P(\X -np\> c) < ^. 

Puesto que nos interesa la razón X/n, que podemos llamar frecuencia relativa del 
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suceso, dividimos la desigualdad \X — np\ > c por n y volvemos a escribir (14.46) 
así 

(14.47) 


Ya que esto es válido para todo c > 0, podemos hacer que c dependa de n y es- 
cribir c = en, siendo e un número positivo fijo. Entonces (14.47) se transforma en 



E1 hecho de que aparezca n en el denominador del segundo miembro sugiere que 
hagamos tender na », Esto nos conduce a la fórmula 

(14.48) lim — — p | > = 0 para todo e > 0, fijo, 

que se denomina la ley de los grandes números para la distribución de Bernoulli 
Ella nos dice que, dado un e > 0 (por pequeno que sea), la probabilidad de que 
la frecuencia relativa del suceso difiera de p en más de e es una función de n que 
tiende a 0 cuando n . Esta relación nos da una justificación matemática para 
la asignación de la probabilidad % al suceso de conseguir cara con una moneda 
perfectamente equilibrada. 

E1 límite (14.48) es un caso particular de un resultado más general en el que 
la «frecuencia relativa» X/n es reemplazada por la media aritmética de n varia- 
bles aleatorias independientes con la misma esperanza y la misma varianza. Este 
teorema más general se conoce con el nombre de ley débil de los grandes núme- 
ros; puede establecerse así: 

TEOREMA 14.12. LEY DÉBIL DE LOS GRANDES NÚMEROS. Sean X lt X 2 , . . . , X„ 
n variables aleatorias independientes, todas con la misma esperanza y la misma va- 
rianza, y sean 

E(X k ) = m y Var (X k ) = a 2 para k = 1,2,... ,n. 

Definamos una nueva variable aleatoria X (llamada media aritmética de X u 
X 2 ,.... X„) mediante la igualdad 
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Entonces, para todo e > 0 , jijo, tenemos 

(14.49) ìimP(\X- m\ > e) = 0. 

Una proposición equivalente es 

(14.50) lim P(\X — m\ < e) = l • 

Demostración. Aplicamos la desigualdad de Chebyshev a X. Para ello ne- 
cesitamos conocer la esperanza y la varianza de X. Éstas son: 

E(X) = m y Var (X) = . 

(Véase el ejercicio 5 de la sección 14.27.) La desigualdad de Chebyshev se con- 
vierte en P(\X — m\ > c) ^ a 2 /(nc 2 ). Haciendo que « -> » y sustituyendo c 
por e obtenemos (14.49) y por lo tanto (14.50). 

Observación. Para demostrar que el límite (14.48) es un caso particular del teore- 
ma 14.12, supongamos que cada X t tiene los valores posibles 0 y 1, con probabilida- 
des P(X k = 1) = p y P(X k = 0) = 1 -_p. Entonces X es la frecuencia relativa de 
éxito en n pruebas independientes, E( X)= p, y (14.49) se reduce a (14.48). 

E1 teorema 14.12 se denomina ley débil porque existe también una ley juerte 
de los grandes números que (bajo las mismas hipótesis) establece que 

(14.51) P^lim |X — m| =ûj = 1. 

La diferencia esencial entre (14.51) y (14.50) es que las operaciones «límite» y 
«probabilidad» están intercambiadas. Puede demostrarse que la ley fuerte implica 
la débil, pero no al revés. 

Obsérvese que la ley fuerte (14.51) parece ser más próxima a la (14.45) que 
a la (14.50). En realidad, (14.51) nos dice que lim X = m «casi siempre», es decir, 
con probabilidad 1. En particular, si la aplicamòs al juego de cara y cruz, nos dice 
que el que no se cumpla la igualdad (14.45) es menos probable que el conseguir 
siempre cara al lanzar repetidamente una moneda correcta. La ley fuerte pone de 
manifiesto por qué la teoría de la probabilidad corresponde a la experiencia y a 
nuestra sensación intuitiva de lo que «debe ser» la probabilidad. 

La demostración de la ley fuerte es larga y la omitiremos. Puede verse en las 
obras citadas en las referencias 1, 3, 8 y 10 del final de este capítulo. 
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14.30 E1 teorema central del límite 

En muchas aplicaciones del Cálculo de probabilidades, las variables aleatorias 
son sumas de otras variables aleatorias. Por ejemplo, el resultado (en dinero) 
después de varias partidas de juego es la suma de las ganancias en cada una. 
Un hecho sorprendente acontece cuando se suman un gran número de variables 
aleatorias. Bajo condiciones generales (aplicable casi a todos los casos prácticos 
que se presentan) la distribución de la suma tiende a ser normal, prescindiendo de 
las distribuciones de cada una de las variables aleatorias que forman la suma. 
E1 enunciado preciso de este hecho notable se conoce como el teorema central del 
lîmite del Cálculo de probabilidades. Lo que explica la importancia de la distribu- 
ción normal tanto en la teoría como en la práctica. La discusión completa de este 
teorema pertenece al estudio superior del Cálculo de probabilidades. En esta sec- 
ción se explicará solamente lo que afirma el teorema. 

Sea una sucesión indefinida de variables aleatorias, X lt X 2 ,, con esperan- 
zas y varianzas finitas. Sean éstas: 

m k = E(X k ) y n k = Var(A' A .), k = 1,2,.... 

Formamos una nueva variable aleatoria S„ sumando las n primeras diferencias 
X k — rrn: 

(14.52) S n =Z(X k -m k ). 


En lugar de las Xk sumamos las diferencias de manera que la suma S„ tendrá por 
valor esperado el 0. E1 problema consiste en determinar la forma límite de la 
función de distribución de S„ cuando n 

Si X lt X 2 ,... ,X„ son independientes, tenemos [en virtud del ejercicio 4 c) 
de la sección 14.27] 

Var (SJ = ^ Var (X k — m k ) = 2 Var (V*.) = J a\. 

Ordinariamente, la Var(S„) será grande aunque las varianzas particulares of sean 
pequenas. Las variables aleatorias con gran varianza no interesan porque sus 
valores tienden a presentar gran dispersión respecto al valor esperado. Por este 
motivo, se introduce una nueva variable aleatoria T„ mediante la fórmula 


Esta variable tiene esperanza 0 y varianza 1 y se llama variable aleatoria reducida. 




690 


Cálculo de probabilidades 


La variable aleatoria reducida T„ tiene pleno sentido aun cuando las variables 
X u X 2 ,..., X„ no sean independientes. 

Introducimos ahora la siguiente definición: 

DEFINICIÓN DE LA PROPIEDAD CENTRAL DEL LÍMITE. Sea 

(14.54) *i, 

una sucesión de variables aleatorias (no necesariamente independientes ), donde 
cada Xk tiene una esperanza m k y una varianza a\ ambas finitas. Se definen S„yT„ 
mediante (14.52) y (14.53). Se dice que la sucesión (14.54) satisface la propiedad 
central del límite si, para todo par a y b siendo a ^ b, tenemos 

(14.55) lim P(a < T„ < b) = -L I <T “ Î/2 du . 

»— V277 J« 

Dicho de otro modo, las variables aleatorias (14.54) satisfacen la propiedad central 
del límite si la distribución de la variable reducida T„ se aproxima a una distribu- 
ción normal cuando n -* «>. [La igualdad (14.55) es válida también si a = — °° 
o b — + °o.] 

Laplace fue el primero en comprobar que muchas sucesiones de variables alea- 
torias satisfacen esta propiedad, si bien antes De Moivre conocía un caso particular 
(el de variables aleatorias que constituyen una sucesión de pruebas de Bernoulli). 
La figura 14.11 muestra una distribución binomial y la correspondiente aproxima- 
ción normal. Laplace estableció un teorema central del límite general que fue de- 
mostrado por primera vez en forma completa por el matemático ruso A. Lyapunov 
en 1901. En 1922, J. W. Lindeberg generalizó el resultado de Laplace demostran- 
do que la propiedad se cumple si las variables aleatorias son independientes y 
tienen una distribución común con las mismas esperanzas y varianzas, o sea 
E(Xk ) — m y Var(X/i) = <r 2 para todo k. En tal caso la variable reducida es: 



Lindeberg se dio cuenta de que tan sólo la independencia no es suficiente para 
garantizar la propiedad central del límite, pero formuló otra condición (la condi- 
ción de Lindeberg) que, junto con la independencia es suficiente. En 1935, 
W. Feller demostró que la condición de Lindeberg es necesaria y suficiente para 
que las variables aleatorias independientes satisfagan la propiedad central del 
límite. Aquí no haremos la discusión de la condición de Lindeberg, sólo mencio- 
naremos que ella implica 


Var (S n ) -*■ oo cuando 
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Afortunadamente, muchas variables aleatorias independientes que en la práctica 
se presentan, satisfacen la condición de Lindeberg y por consiguiente también la 
propiedad central del límite. Hasta ahora, la teoría para variables aleatorias depen- 
dientes es incompleta. Tan sólo se han tratado unos pocos casos particulares. 
La investigación contemporánea en Cálculo de probabilidades en gran parte está 
centrada en la búsqueda de teoremas generales referentes a variables dependientes. 

14.31 Ejercicios 

1. Demostrar la desigualdad de Chebyshev en el caso discreto. 

2. Si a es un número real cualquiera, demostrar que 

PQX - a\ > cX) <. ^ 

para todo c > 0, siendo \ 2 — (í— a) 2 f x (t) dt. La desigualdad de Chebyshev es el 

caso particular en el que a = E(X). 

3. Sea X la variable aleatoria que cuenta el número de éxitos en rt pruebas independientes 
de una sucesión de Bemoulli; la probabilidad de éxito es p. Demostrar que, para todo 
e > 0, 



4. Se lanza n veces una moneda «correcta»; el número de caras se representa por X. En- 
contrar el menor valor de n para el que la desigualdad de Chebyshev implique 

7^0.4 < ^ <0.ój >0.90. 

5. En una cadena de producción el número X de artículos manufacturados defectuosos en 
una determinada hora se sabe que tiene una distribución de Poisson con media 
E(X) = 100. Emplear la desigualdad de Chebyshev para calcular una cota inferior para 
la probabilidad de que en una hora determinada los artículos defectuosos producidos 
esté comprendidos entre 90 y 110. 

6. Supongamos que una variable aleatoria X tenga una distribución normal canónica 
(media 0 y varianza 1). Representemos con p la probabilidad de que X difiera de su es- 
peranza E(X) en más de tres veces la desviación típica. Aplicar la desigualdad de 
Chebyshev para encontrar una cota superior de p. Seguidamente, usando las corres- 
pondientes tablas de la distribución normal, comprobar que hay una cota superior de p 
que es aproximadamente igual a un cincuentavo de la obtenida por la desigualdad de 
Chebyshev. 

7. Dada una sucesión de variables independientes X,.X->, ... ,con distribución normal cada 
una. Sean m k = E(X k ) y o* = Var (X k ). Probar que tal sucesión tiene la propiedad cen- 
tral del limite. [ Indicación: Recuérdese el ejercicio 7 de la sección 14.24.J 

8. Sean las variables aleatorias independientes X,,X->, .... con la misma distribución bino- 
mial. Supongamos que cada X t toma los valores 0 y 1 con probabilidades P(X t = 1) = p 
y P(X k = 0) = q, siendo p + q = 1. La variable aleatoria Z„ = X t + X > + ... + X„ 
cuenta el número de éxitos en n pruebas de Bernoulli. 
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a) Dcmostrar quc la propicdad ccntral dcl límite toma la forma siguicntc: 



b) Usar la aproximación sugcrida en la partc a) para cstimar la probabilidad dc obtc- 
ncr un número de caras comprendido entre 45 y 55 si sc lanza 100 vcccs una moneda 
corrccía. Rccurrir a tablns dc distribución normal para rcalizar cl cálculo. 

9. Con la notación del ejercicio 8, el teorema central dcl límite para variables alcatorias 
quc forman una sucesión de pruebas de Berooulli pucdc escribirsc en la forma 




donde <I> es la distribución normal canónica. En este caso particular puede demostrarse 
que la fórmula también es válida cu ando fi y t-< son funciones de n dadas por 
U = (« - np)j ''J npq y t> = (b — np)/y/ npq, donde a y b son constantes positivas pre- 
fijadas, a < b. 

a) Demostrar qite esta relación imptica la fórmula asintótica 


î C) 


b) Se lanza un dado insesgado o correcto 180 veces. Usar la aproximación sugerida en 
la parte a) para estimar la probabilidad de que salga un seis exactamente 30 veces. Para 
los cálculos hacer uso de las tablas de distribución normal 14.1. 

10. Se lanza un dado insesgado o correcto 100 veces. Utilizar la aproximación sugerida en 
el ejercicio 9 a) para estimar la probabilidad de que salga un seis a) exactamente 25 ve- 
ces, b) por lo menos 25 veces. Para los cálculos utilizar tablas de distribución normal. 
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INTRODUCCIÓN AL ANÁLISIS NUMÉRICO 


15.1 Introducción históríca 

E1 planeta Urano fue descubierto en 1781 por un inteligente astrónomo afi- 
cionado, William Herschel (1738-1822), con un telescopio de fabricación casera. 
Teniendo en cuenta las leyes de Kepler, la prevista órbita de Urano fue rápida- 
mente calculada a partir de unas pocas observaciones muy separadas entre sí. Se 
encontró que la distancia media de Urano al Sol era aproximadamente el doble 
que la de Saturno y que una órbita completa requeriría 84 anos. En 1830 los datos 
empíricos acumulados pusieron de manifiesto desviaciones inexplicables de la 
órbita prevista. Algunos astrónomos llegaron a pensar que la ley de la gravitación 
universal de Newton no fuera válida para distancias tan grandes como la de Urano 
al Sol; otros sospecharon que las perturbaciones fueran debidas a un cometa aún 
no descubierto o a un planeta más lejano. 

Un estudiante del bachillerato de la Universidad de Cambridge, John Couch 
Adams (1819-1892), estaba intrigado por la posibilidad de un planeta descono- 
cido. Se asignó la difícil tarea de calcular la influencia de un tal planeta en las 
posiciones observadas de Urano, suponiendo válida la ley de gravitación de New- 
ton. Completó su cálculo en 1845 e instó al Real Obseryatorio de Greenwich a 
buscar el supuesto planeta, pero su requerimiento no fue tomado en serio. 

Independientemente y casi simultáneamente Jean Joseph Leverrier (1811- 
1877) de París, realizó un cálculo parecido y pidió a Johann Galle, jefe del Obser- 
vatorio de Berlín, que confirmara su predicción. La misma noche que recibió la 
carta de Leverrier, Galle encontró el nuevo planeta, Neptuno, casi exactamente 
en la posición calculada. Éste fue otro triunfo de la ley de gravitación de Newton, 
y uno de los primeros grandes triunfos del análisis numérico, el arte y la ciencia 
de calcular. 

La historia del análisis numérico data de tiempos antiguos. Los babilonios, 
2000 anos a.J., compusieron tablas matemáticas. Se ha encontrado una tablilla 
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de barro con los cuadrados de los enteros del 1 al 60. Los babilonios adoraban 
los cuerpos celestes y elaboraban efemérides astronómicas. E1 famoso astrónomo 
alejandrino Claudio Ptolomeo (aproximadamente 150 d.J.) poseía unas efeméri- 
des babilónicas de eclipses que databan del ano 747 a.J. 

Arquímedes, en el ano 220 a.J., usó los polígonos regulares como aproxima- 
ciones del círculo y dedujo las desigualdades 3^%! < ir < 3 l / 7 . E1 trabajo de 
cálculo numérico desde entonces hasta el siglo xvn fue centrado principalmente 
en la preparación de tablas astronómicas. E1 advenimiento del Álgebra en el 
siglo xvi produjo una renovada actividad en todas las ramas de la Matemática, 
incluyendo el análisis numérico. En 1614, Neper publicó la primera tabla de loga- 
ritmos, y en 1620, los logaritmos de las funciones seno y tangente fueron tabuladas 
con siete cifras decimales. Hacia 1628 habían sido calculadas tablas de logaritmos 
con catorce decimales de los números 1 al 100 000. 

E1 cálculo con series empezó a florecer hacia fines del siglo xvii, con el de- 
sarrollo del cálculo. A principios del siglo xvm Jacob Stirling y Brook Taylor 
sentaron los fundamentos del cálculo de diferencias finitas, que ahora desempena 
un papel central en el análisis numérico. Con la predicción de la existencia y la 
localización del planeta Neptuno por Adam y Leverrier en 1845, la importancia 
científica del análisis numérico quedó establecida de una vez para siempre. 

A fines del siglo xix, el empleo de las máquinas de cálculo automático esti- 
muló aún más el desarrollo del análisis numérico. Tal desarrollo ha sido explosivo 
desde la terminación de la segunda Guerra Mundial a causa del progreso en las 
máquinas de cálculo electrónicas de alta velocidad. Las nuevas máquinas han 
hecho posibles gran número de importantes logros científicos que antes parecían 
inaccesibles. 

E1 arte de calcular (distinto de la ciencia de calcular) da gran importancia a 
la elaboración minuciosa del plan que se necesita en un determinado cálculo. Tam- 
bién trata cuestiones tales como, la precisión y exactitud, los errores, y la com- 
probación. Este aspecto del análisis numérico no lo vamos aquí a discutir; se 
aprende mejor al efectuar los cálculos numéricos en problemas concretos. Para 
tener un buen conocimiento de los métodos prácticos y técnicos a seguir, el lector 
debería consultar los libros que existen sobre análisis numérico, algunos de los 
cuales se citan en la Bibliografía al final de este capítulo. La bibliografía contiene 
también algunas de las tablas matemáticas más usadas, muchas de las cuales dan 
también información práctica de cómo hay que proceder en un cálculo deter- 
minado. 

Este capítulo es una introducción a la ciencia del cálculo. Contiene algunos 
de los principios matemáticos básicos que precisa quien maneja el análisis numé- 
rico, tanto si trabaja en gabinete o con una máquina calculadora de alta velo- 
cidad. Aparte de su valor práctico, la materia de este capítulo tiene interés por 
derecho propio, y es de esperar que esta breve introducción estimulará al lector 
a profundizar más en esta importante y fascinante rama de la Matemática. 
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15.2 Aproximaciones por polinomios 

Una idea básica en análisis numérico es la de utilizar funciones sencillas, de 
ordinario polinomios, para aproximar una función dada /. En el volumen I se vio 
un tipo de polinomio de aproximación al tratar de la fórmula de Taylor (teore- 
ma 7.1). E1 problema fue entonces encontrar un polinomio P que coincidiera con 
una función dada / y con algunas de sus derivadas en un punto dado. Se demos- 
tró que si / es una función con derivada de orden n en un punto a, existe un poli- 
nomio P y sólo uno, de grado ^ n que satisface las n + 1 relaciones 


P(a)=f(a), P'(a) =/'(«), ..., P^(a) =/<">(«). 

La solución viene dada por el polinomio de Taylor, 


También se discutió el error que se comete aproximando f(x) por P(x) en puntos x 
distintos del a. Tal error se define por la diferencia E n (x) = f(x) - P(x), de 
modo que podemos escribir 

w. 

Para estudiar más profundamente el error necesitamos mayor información acerca 
de la función /. Por ejemplo, si / posee derivada de orden n + 1 continua en un 
cierto intervalo que contenga a, entonces para todo x de ese intervalo el error 
puede expresarse en forma de integral o como una derivada de orden n + 1: 

E n (x) = ^ JJ (* - t) n f in+1 \t) dt = ^ + ^ (x - a) n+1 , 

siendo c un punto situado entre a y x. (Ver secciones 7.5 y 7.7 del volumen I.) 

Existen muchos otros métodos para aproximar una función dada / mediante 
polinomios, dependiendo del uso que debe hacerse de la aproximación. Por ejem- 
plo, en lugar de querer hallar un polinomio que coincida con / y con algunas de 
sus derivadas en un punto dado, podemos desear un polinomio que tome los 
mismos valores que / en un cierto número de puntos distintos. Concretamcnte, si 
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los puntos dados son x 0 , x lt ..., x„ podemos buscar un polinomio P que satisfaga 
las condiciones 


(15.1) P(x„) =f(x 0 ), P( Xl ) =f( Xl ), ..., P(x n ) =f(x n ). 

Puesto que hay n + 1 condiciones a satisfacer intentamos resolver el problema 
con un polinomio de grado ^ n, sea éste 

P(x) 


con n + 1 coefìcientes a 0 ,a 1 ,...,a n a determinar. Las n + 1 condiciones (15.1) 
nos conducen a un sistema de n + 1 ecuaciones de primer grado entre los coefi- 
cientes. Según la teoría de las ecuaciones lineales puede demostrarse que este sis- 
tema tiene una y una sola solución; luego el citado polinomio existe siempre. Si 
el sistema se resuelve por la regla de Cramer, los coeficientes a 0 , a 1 ,...,a n se 
expresan como cocientes de determinantes. En la práctica, no obstante, el polino- 
mio P rara vez se determina de este modo debido a que los cálculos son extrema- 
damente laboriosos cuando n es grande. Se han desarrollado métodos más senci- 
llos para calcular los polinomios de aproximación. Algunos de ellos serán discutidos 
en secciones posteriores. E1 polinomio que resuelve el problema antes citado se 
llama polinomio de interpolación. 

Otro tipo corriente de polinomio de aproximación es el llamado de aproxi- 
mación por mínimos cuadrados. En este caso, la función dada / está definida y es 
integrable en un intervalo [a, 6] y buscamos un polinomio P de grado ^ n tal que 
el error cuadrático medio 


f l/W - P(*)\* dx 

sea lo menor posible. En la sección 15.4 demostraremos que para una función con- 
tinua / tal polinomio existe y es único. Los polinomios de Legendre introducidos 
en la sección 1.14 desempenan un papel fundamental en la resolución de ese 
problema. 

15.3 Aproximaciones polinómicas y espacios lineales normados 

Los distintos tipos de aproximación por polinomios descritos en la sección 
anterior están relacionados por medio de una idea central que se describe mejor 
con la nomenclatura de los espacios lineales. 

Sea V un espacio lineal de funciones que contiene todos los polinomios de 
grado í/iy que también contiene la función / que debe aproximarse. Los poli- 
nomios constituyen un subespacio S de dimensión fìnita, siendo dim S = n + 1. 
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Cuando hablamos de la aproximación de / mediante un polinomio P de S, consi- 
deramos la diferencia / — P, que llamamos error de la aproximación, y tratamos 
entonces de encontrar un método para medir la magnitud de ese error. 

Si V es un espacio euclídeo, tiene un producto interior (x, y) y una corres- 
pondiente norma dada por ||x|| = (x, x)' A , y podemos usar la norma \\f — P\\ 
como medida del tamano del error. 

Algunas veces pueden introducirse normas en espacios lineales no euclídeos, 
esto es, en espacios lineales desprovistos de producto interior. Tales normas se 
introdujeron en la sección 7.26. Repetimos aquí la definición. 

definición de norma. Sea V un espacio lineal de funciones. Una función 
real N definida en V se llama norma si tiene las propiedades siguientes: 

a) N(f) S: 0 para cada f de V. 

b) N(cf) = \c\N(f) para cada f de V y cada número real c. 

c) N(f + g) ^ N(f) + N(g) para todo par de funciones f y gdeV. 

d) N(f) = 0 implica / = 0. 

Un espacio lineal con una norma asignada se denomina espacio lineal normado. 

Algunas veces la norma de / se representa por |]/|| en lugar de N(f). Con esta 
notación, las propiedades fundamentales se escriben: 

a) 11/11 ^ 0, 

b) ||c/|| = |c| H/ll, 

0 II/ + g|| * ll/ll + llgll, 

d) ||ý|| = 0 implica / = 0. 

Una función N que satisface las propiedades a), b) y c), pero no la d), se 
llama seminorma. Algunos problemas de la teoría de la aproximación tratan con 
espacios lineales seminormados; otros con espacios lineales normados. Los ejem- 
plos siguientes se discutirán en este capítulo. 

ejemplo 1. Seminorma de Taylor. Para un entero fìjo n ^ 1, sea V el con- 
junto de todas las funciones que poseen derivada de orden n en un punto fijo a. 
E1 conjunto V es un espacio lineal. SifeV, sea 

JV(/)=Ìl/ <fc, (a)|. 

1e =0 

Es fácil comprobar que la función N así definida es una seminorma. No es una 
norma porque N(f) = 0 si y sólo si 

f(à) =f(a) = ■■■ =/<">(a) = 0, 

y esas ecuaciones pueden satisfacerse con una función no nula. Por ejemplo, 
N(f) = 0 cuando f(x) = (x — a) n+1 . 
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ejemplo 2. Seminorma de interpolación. Sea V el espacio lineal de todas 
las funciones reales definidas en un intervalo [a, &]. Para un conjunto fijo de 
n + 1 puntos distintos x 0 , x lf ..., x„ de [a,fc],definamos N mediante la ecuación 


*(/)=Ì !/(**)! 


si f e V. Esta función N es una seminorma en V. No es una norma porque 
N(f) = 0 si y sólo si f(x„) = f(x t ) — ... = f(x n ) = 0, y es evidente que esas ecua- 
ciones se pueden satisfacer con una función / no nula en [a, 6]. 

ejemplo 3. Norma cuadrática. Sea C el espacio lineal de las funciones con- 
tinuas en un intervalo [a, 6]. Si / 6 C definimos 

(15.2) N(f)= (j b a \f(x)\*dx) m . 

Esta es una norma consecuencia del producto interior. 

(/, g) = / o 7(x)i«dx. 

Observación. Representemos con S el conjunto de todas las funciones f que son 
integrables en [a, b). E1 conjunto S es un espacio lineal, y la función N definida 
en (15.2) es una seminorma en S. No es una normaporque puede ser N(/)=0 sin que 
/ sea idénticamente nula en [a, b). 

ejemplo 4. Norma del máximo. Representemos con C el espacio lineal de 
las funciones continuas en un intervalo [a, 6]. Si / e C, definimos 


N(f) = max |/(x)|, 

a<x<b 


en donde el símbolo del segundo miembro representa el máximo absoluto de |/| 
en [a, &]. En el ejercicio 4 de la sección 15.5 se pide la comprobación de las cua- 
tro propiedades de la norma. 

15.4 Problemas fundamentales en la aproximación por polinomios 

Sea C el espacio de las funciones continuas en un intervalo dado [a, b], y 
sea S un subespacio lineal que contiene todos los polinomios de grado ^ n. Su- 
pongamos también que en C se ha definido una norma o una seminorma. Elija- 
mos una función / deC. Si existe un polinomio PenS tal que 

ll/-i , ll< \\f-Q\\ 
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para todo polinomio Q de S, decimos que P es el polinomio de aproximación 
óptima para / con grado asignado. La palabra «óptima» es relativa a la norma 
dada (o la seminorma). E1 polinomio de aproximación óptima para una cierta 
norma elegida no lo es necesariamente si se elige otra. 

Una vez elegidas una norma o seminorma, se presentan inmediatamente tres 
problemas. 

1. Existencia. Dada f de C, ^existe el polinomio de aproximación óptima 
para / con grado prefìjado? 

2. Unicidad. Si existe ese polinomio, ies único? 

3. Construcción. iCómo puede determinarse, si existe, el polinomio de apro- 
ximación óptima para / con grado prefìjado? 

Existen, como es natural, otros muchos problemas que pueden considerarse. 
Por ejemplo, si existe un único polinomio de aproximación óptima P n de grado 
< n , podemos desear obtener cotas superiores de ||/ — P„|| que se puedan utilizar 
para satisfacer ciertas necesidades prácticas. O podemos averiguar si ||/ — Pnj| 0 
cuando n -> oo para una norma dada o para alguna otra norma. Si es así, decimos 
que los polinomios de aproximación convergen hacia / en esta norma. En tal caso 
existen aproximaciones tan ajustadas como se quiera con relación a esa norma si n 
es suficientemente grande. Estos ejemplos muestran algunos de los problemas que 
se estudian en la teoría general de la aproximación con polinomios. En este estu- 
dio preliminar dedicamos nuestra atención especialmente a los tres problemas de 
existencia, unicidad y construcción antes citados. 

Esos tres problemas se pueden resolver totalmente en el caso de la aproxima- 
ción mediante polinomios de Taylor. Si / posee derivada de orden n en un punto 
a, es fácil probar que el polinomio de aproximación óptima de grado ^ n rela- 
tivo a la seminorma de Taylor para este n es el polinomio de Taylor 

(15.3) P(x) “ a) *' 

*=o K ' 

En efecto, para este polinomio tenemos 

II/-PII =2l/ tt, ( fl ) - plkì ( a )\ = °> 


así que la desigualdad ||/— P|| l|/ - Q|| se satisface para todo polinomio Q. 

Por lo tanto, P es el polinomio de aproximación óptima relativo a esa seminorma. 
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Para establecer la unicidad, consideramos un polinomio cualquiera Q de grado 
^ n tal que ||/ — Q|| = 0. Esta ecuación implica que 

Q(a)=f(a), Q'(a)=f'(á) . Q^(a) =/<”>(a). 

Según el teorema 7.1 del volumen I sabemos que el polinomio de Taylor (15.3) 
es el único polinomio que satisface todas esas condiciones. Por consiguiente, 
Q = P. La ecuación (15.3) resuelve también el problema de la construcción. 

Los tres problemas pueden también resolverse para cualquier norma dedu- 
cida de un producto interior. En este caso, el teorema 1.16 nos dice que existe 
un solo polinomio en S para el cual la norma ||/ — P|| es tan pequena como se 
quiera. En efecto, este P es la proyección de / sobre S y viene dado por la 
fórmula explícita, 


n*)=jXP,*Mx). 

en donde e 0 , e lt ..., e„ son funciones que constituyen una base ortonormal para S. 

Por ejemplo, si C es el espacio de las funciones reales continuas en el inter- 
valo [ — 1,1] y si 


(f, g) = j^f(x)g(x)dx, 

los polinomios de Legendre normalizados <f 0 , <p lt ...» <p„ forman una base orto- 
normal para S, y la proyección f„ de / sobre S viene dada por 

fn(x) =ì(f’ <P*)<P*( X ) ’ dond e (/> <Pk) = jjj(t)<Pk(t) dt. 
Recordemos que los polinomios de Legendre normalizados vienen dados por 

%(*) = donde P k (x) = ±--f-(x*- íf. 

V 2 2*7c! dx 

Los seis primeros son 

<p 0 (x) = V >, < Pl (x) = Jìx, <p 2 (x) = lJu 3x*-l), <p 3 (x) = Wi(5x 3 - 3*), 

<Pi(x) = iVÎ (35x 4 - 30x s + 3), <Pò(x) = iV x f (63x s - 70x 3 + 15x). 

Los problemas correspondientes a la seminorma de interpolación se tratarán 
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en la próxima sección 15.6. En secciones posteriores estudiaremos la aproxima- 
ción por polinomios relativa a la norma del máximo. 

15.5 Ejercicios 


1. Demostrar que cada uno de los siguientes conjuntos de funciones es un espacio lineal 

a) Todos los polinomios. 

b) Todos los polinomios de grado < n. 

c) Todas las funciones continuas en un intervalo /. 

d) Todas las funciones derivables en cada punto de /. 

e) Todas las funciones que tienen dcrivada de orden n en cada punto dc /. 

f) Todas las funciones con derivadas de orden n en un punlo fijo x«. 

g) Todas las funciones desarrollables en serie dc potencias cn un entorno de un punto 
dado x«. 

2. Determinar si cada uno de los siguientes conjuntos de funcioncs es o no un espacio lineal. 

a) Todos los polinomios de grado n. 

b) Todas las funciones defínidas y acotadas en un intervalo [a, 6]. 

c) Todas las funciones definidas en un intervalo [a,b]. 

d) Todas las funciones monótonas en un intervalo [a, b]. 

e) Todas las funciones integrablcs en un intervalo [a, b]. 

f) Todas las funciones regulares a trozos monótonas en un intervalo [a,b]. 

g) Todas las funciones que pueden txpresarse en la forma / — g, siendo / y g monó- 

tonas crecientes en un intervalo [a, b]. 

3. Sea C el espacio lineal de las funciones reales continuas en un intervalo [a, b]. Mediante 
la ecuación que se da, se define en C una función N. En cada caso, determinar cuáles 
de las cuatro propiedades de una norma satisface N, y determinar de este modo si N es 
una norma, una seminorma, o ni una cosa ni otra. 


a) N(f) — f(a). 

e) N(f) =\j*f(x)dx\. 

b) N(f) = \f(a)\. 

0 N(f) = j b a \f(x)\dx. 

c) N(f) = \f(b) - f(a)\. 

g) N(f) = j b a \f(x)\*dx. 

d) N(f) =\j(x)dx. 

h) N(f) = \^J(x)dx^ 


4. Sea C el espacio lineal de las funciones continuas en un intervalo [a,b]. Si feC, de- 
finimos 


N(f) = max |/(*)|. 

a<x<b 


Demostrar que N es una norma para C. 

5. Representemos por B el espacio lineal de todas las funciones reales definidas y acotadas 
en un intervalo [a, b]. Si / e B definimos 


N(f) = sup ]f(x)\, 

a<x<b 
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donde el símbolo del segundo miembro representa el extremo superior del conjunto de 
todos los números \f(x)\ para x én [a, 6]. Demostrar que N es una norma para B. Esta 
es la norma del supremo. 

6. Refiriéndose al ejercicio 3, determinar cuáles de las funciones dadas N tienen la propie- 
dad de que N(fg) < N(f)N(g) para todo par de funciones f y g de C. 

7. Para un entero fijo n > 1, sea S el conjunlo de fodas las funciones con derivada n-ésima 
en un punto x 0 . Si feS, sea 


N(f) = ^\f*Kx 0 )\. 

*=o 

a) Demostrar que N es una seminorma en S. 

b) Demostrar que N(fg) < N(f)N(g) cualesquiera que sean f y g de S. Demostrar 
también que la seminorma de Taylor no goza de esa propiedad. 

8. Sea f una función real continua en el intervalo [ — 1,1]. 

a) Demostrar que el polinomio cuadrático de aproximación óptima relativo a la norma 
cuadrática en [ — 1,1] viene dado por 

P(x) = \ j' jit) dt + |x £ tf(t) dt + f (3x® - 1) (3í 2 - 1)/(/) dt. 

b) Encontrar una fórmula análoga para el polinomio de aproximación óptima de 
grado < 4. 

9. Calcular las constantes a, b, c de modo que la integral \e* — (a + bx + cx 2 )| 2 dx 
llegue a ser tan pequena como se quiera. 

10. Sea f(x) = \x para-1 < x < 1. Determinar el polinomio de grado < 4 de aproximación 
óptima para / en [ — 1,1] relativo a la norma cuadrática. 

11. Sea C el espacio lineal de las funciones reales continuas en [a,b] con producto interior 
(f, g) = \ b a f(x)g(x) dx. Sea e 0 ,... ,e n una base ortonormal para el subespacio S de los 
polinomios de grado < n. Sea P el polinomio de S de aproximación óptima para f en C 
relativo a la norma cuadrática. 

a) Demostrar que el cuadrado de la norma det error viene dado por 


ll/-.p|| 2 = ll/ll 2 -Ì(/,«*) 2 . 


b) Calcular explícitamente ese error cuando [a, b) = [ — 1,1], n = 2, y f(x) = |x|. 

12. Sea f(x) = 1/x para x ^ 0. 

a) Demostrar que el polinomio constante P de aproximación óptima para / en el inter- 
valo [l,n] relativo a la norma cuadrática es P(x) = (log n)/(n — 1). Calcular ||P — /|| 2 
para este P. 

b) Hallar el polinomio lineal P de aproximación óptima para / en el intervalo [l,n] 
relativo a la norma cuadrática. Calcular ||P — /|| 2 para este P cuando n = 2. 

13. Sea f(x) = e*. 

a) Demostrar que el polinomio constante P de aproximación óptima para / en el inter- 
valo [0, n] relativo a la norma cuadrática es P(x) = (e' — 1 )/n. Calcular ||P - /jj 2 para 
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b) Hallar el polinomio lineal P de aproximación óptima para f en el intervalo [0,1 ] 
relativo a la norma cuadrática. Calcular ||P —/|| 2 para este P. 

14. Sean Po,Pt,...,P„ n+1 polinomios ortonormales en [fl, b] relativos al producto 

interior del ejercicio 11. Supóngase también que P t es de grado k. 
a) Demostrar que tres polinomios consecutivos cualesquiera de ese conjunto están liga- 
dos por una relación de recurrencia de la forma 


P k+1 (x) = («fcX + b k )P k (x) + c k P k _i(x) 

para 1 < k < n — 1, siendo a t , b t , c t constantes. , 

b) Determinar explícitamente esa relación de recurrencia cuando los polinomios son los 
polinomios de Legendre ortonormales. 

15. En relación con el ejercicio 14, y designando por p t los coefacientes de x en Ct(x). 

a) Demostrar que a t = p»+i/p*. . , 

b) Utilizar la relación de recurrencia del ejercicio 14 para deducir la tormula 

^ p m P m+ i(x)P n (y) - Prn(x)P m+ l(y) 

=^--’ 

válida para z/y. Discutir también el caso límite x = y. 


15.6 Polinomios de interpolación 

Volvemos ahora a la aproximación mediante polinomios de interpolación. Se 
conocen los valores de una función / en n + 1 puntos distintos x 0 , x u ..., x„ y 
buscamos un polinomio P de grado ^ n que satisfaga las condiciones 

(15.4) P(x 0 ) =f(x 0 ), P(x0=f(x i), •••» P(x„)=f(x n ). 

Primero demostramos que si existe tal polinomio, éste es único. Luego probamos 
su existencia por medio de su construcción explícita. Este polinomio hace mínima 
la distancia de / a P, medida con la semincrma de interpolación para ese n, 

\\f-P\\ =î\f(x k )-P(x k )\. 

k =0 

Puesto que la distancia es 0 si P satisface (15.4), el polinomio de interpolación P 
es el de aproximación óptima relativo a aquella seminorma. 

teorema 15.1. teorema de unicidad. Dados n + 1 puntos distintos Xo, 
Xj , sean P y Q dos polinomios de grado ^ n tales que 

P(x k ) = Q(x k ) 

para cada k = 0, 1,2, ..., n. Entonces P(x) = Q(x) para todo x. 
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Demostración. Sea R(x) = P(x) - Q(x). La función R es un polinomio de 
grado ^ n que tiene n + 1 ceros distintos en los puntos x„, x lf ..., x„. E1 único 
polinomio que goza de esta propiedad es el polinomio nulo. Por lo tanto, R(x) = 0 
para todo x, luego P(x) = Q(x) para todo x. 

E1 polinomio de interpolación P puede construirse de varias maneras. Expo- 
nemos primero un método de Lagrange. Sea A(x) el polinomio dado por la 
ecuación 

(15.5) X(x) = (x - x 0 )(x - Xj) • • • (x - x„) = TT(x - Xj). 


Este polinomio tiene un cero simple en cada uno de los puntos x,-. Sea Ak(x) el 
polinomio de grado n obtenido del A(x) por la supresión del factor x — x k . Esto es, 

(15.6) Mx)=Tl(x-x s ). 


E1 polinomio A k (x) tiene un cero simple en cada punto x/ ¥=■ x k . En el punto x k 
tenemos 

(15.7) Mx^-x,. 


Este producto no es cero ya que ningún factor lo es. Por consiguiente, el polinomio 
A k (x)/A k (x k ) toma el valor 1 cuando x = x k y el valor 0 cuando x = x> para 
X/ ¥= x k . Sea ahora 


k= 0 


f(x k )A k (x) 

M* k ) 


Cuando x = X/, cada término de esta suma se anula excepto el término de lugar /, 
que toma el valor f(x t ). Por consiguiente, P(x,) = /(x,) para cada j. Puesto que 
cada término de esta suma es un polinomio de grado n, la suma es a su vez un 
polinomio de grado =£ n. Así pues, hemos encontrado un polinomio que satisface 
las condiciones exigidas. Estos resultados podemos resumirlos en el teorema si- 
guiente: 


teorema 15.2. Dados n + 1 puntos distintos x„, x lf ..., x„ y n + 1 nú- 
meros reales f(x 0 ), /(x^), ..., f(x„), no necesariamente distintos, existe un polino- 
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mio P y sólo uno de grado * n tal que P(Xj) = f(Xj) para cada j = 0, l, 2, ..., n. 
Este polinomio viene dado por la fórmula 


(15.8) 


fc =0 


f(x k )A k (x) 
A k (x k ) 


en donde A k (x) es el polinomio definido por (15.6). 

La fórmula (15.8) que da P(x) se llama fórmula de interpolación de Lagrange. 
Podemos ponerla en la forma 


P(x)=lf(x k )L k (x), 

fc =0 

donde L k (x) es un polinomio de grado n dado por 


(15.9) 


L k (x) 


A k (x) 

' A k (x k )‘ 


De este modo, para cada x fìjo, P(x) es una combinación lineal de los valores pre- 
fijados /(*o), f(Xi), ..., f(x„). Los multiplicadores L k (x) dependen tan sólo de los 
puntos x„, x u ..., x„ y no de los valores prefijados antes citados. Se llaman 
coeficientes de interpolación de Lagrange. Si utilizamos las fórmulas (15.6) y 
(15.7) podemos escribir la ecuación (15.9) en la forma 


(15.10) 


L k (x) = 



Esta fórmula proporciona un método eficiente para calcular el número L k (x) para 
un x dado. 


Observación. Los coeficientes de Lagrange L k (x) se expresan frecuentemente en 
la forma 


L k (x) = 


A'(x k ) ’ 


donde A’ es la derivada del polinomio (15.5). Para demostrar esa fórmula basta 
probar que A'(x k ) = Derivando la relación 


A(x) = (x - x k )A k (x) 


obtenemos A'(x) = (x - x t )A' t (x) + A t (x). Cuando x = x k se obtiene A'(x t ) = A t (x t ). 
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ejemplo. Determinar el polinomio de grado 3 q Ue toma los valores y 0 » 
yi, y 2 , y 3 en los puntos - 2 , — 1 , 1 , 2 respectivamente. 

Solución. Tomamos x 0 = —2, x* = —1, x 2 = 1, x 3 = 2. Los polinomios 
Lk(x) dados por (15.10) son ahora 


L 0 (x) = 


(x + l)(x - l)(x - 2 ) 
(-2 + 1)(—2 - 1)(—2 - 2 ) 


-^(x + l)(x-l)(x- 2 ), 


L x (x) = 


L 2 (x) = 


L 3 (x) = 


(x + 2 )(x - l)(x - 2 ) 

( —1 + 2)(—1 — 1)(—1 — 2 ) 


= “ (x + 2 )(x — l)(x — 2 ), 


(x + 2 )(x + l)(x ~ 2 ) 

(1 + 2)(1 + 1)(1 - 2 ) 


— ~ (x + 2 )(x + l)(x — 2 ), 


(x + 2 )(x + l)(x - 1 ) 

(2 + 2)(2 + 1)(2 - 1) 


= ~ (x + 2 )(x + l)(x — 1 ). 


Por lo tanto, el polinomio que se busca es 

P(x) = y,L 0 (x) + yi L,(x) + y 2 L 2 (x) + y 3 L 3 (x) 

= ~ f%( x + 1)(* ~ 1)(* - 2) + ^(x + 2)(x - l)(x - 2) 

~ J( x + 2)(x + l)(x - 2) + ^(x + 2)(x + l)(x - 1). 

Para calcular el valor de P(x) para un x determinado es mejor dejar el polinomio 
en esta forma en lugar de ordenarlo en potencias crecientes de x. Por ejemplo, si 
y, = — 5, yi = 1, y 2 = 1, e y 3 = 7, el valor de P(x) para x = % viene dado por 

P® = A(t)(*)(-i) + m(ì)(-l) - i(ï)(t)(-t) + A(î)(i)(i) 

= -tt - A + It + W = ¥« â = 21. 


15.7 Puntos de interpolación igualmente separados 

En la discusión anterior se ha supuesto que los puntos de interpolación 
Xo, x lt . .., x„ eran distintos, pero por lo demás cualesquiera. Si ahora suponemos 
que están igualmente separados, vamos a demostrar que los coeficientes de Lagran- 
ge se simplifican considerablemente. Supongamos x 0 < x, <x 2 < .. . < x„, y que 
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h es la distancia entre cada dos puntos consecutivos. Podemos entonces escribir 
Xj = + jh 

para / = 0, 1, 2,..., n. Ya que x k - Xj = (k - j)h, la ecuación (15.10) se trans- 
forma en 


(15.11) 


L k (x) = fr 

j*Jc 


x-xp- jh 
(k - j)h 


= fr 


t-j 
k — j’ 


donde 


X — Xg 

h 


En el último término del segundo miembro de (15.11) el producto de los factores 
independientes de t es 


(15.12) 




(—!)”-* _ (—!)”-* /») 
k! (n — k)\ n\ \k) ’ 


siendo (*) el coeficiente binomial. Puesto que x — x 0 + th, la ecuación (15.11) 
se escribirá ahora 


(15.13) 


L k (x o + th) = (ì\ TF (t ~ j) ■ 

' 7 i*k 


Para cada n fijo, el segundo miembro de (15.13) es una función de k y de t 
que puede tabularse. En el National Bureau of Standards se prepararon tablas de 
coeficientes de Lagrange para puntos de interpolación igualmente separados. (Véase 
referencia 13 en la bibliografía del final de este capítulo.) Si x y h se eligen de 
manera que el número t = (x - x n )/h es tal que para él han sido tabulados los 
coeficientes de Lagrange L k (x 0 + th), el cálculo de P(x n + th) se reduce a una 
multiplicación de f(x k ) por el valor tabulado L k (x n + th), seguida de adición. 

15.8 Análisis del error de la ìnterpolación por polinomios 

Sea / una función definida en un intervalo [a, 6] que contiene los n + 1 pun- 
tos x 0 , Xn , y sea P el polinomio de interpolación de grado ^ n que coin- 

cide con / en aquellos puntos. Si alteramos los valores de / en puntos distintos de 
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los de interpolación no variará el polinomio P. Esto prueba que la función / y el 
polinomio P pueden diferir considerablemente en los puntos distintos a los de 
interpolación. Si la función dada / tiene ciertas cualidades de «regularidad» en el 
intervalo \a, 6 ] podemos esperar que el polinomio de interpolación P será una 
buena aproximación de / en los puntos distintos de los x k . E1 teorema que sigue 
nos da una útil expresión que nos permite estudiar el error en la interpolación 
por polinomios cuando la función dada posee derivada de orden n + 1 en \a, &]. 

teorema 15.3. Sean x„, x lt ..., x„, n + 1 puntos distintos en el dominio 
de una función f, y P el polinomio de interpolación de grado ^ n que coincide 
con f en esos puntos. Elijamos un punto x en el dominio de f y sea [<*, /?] un in- 
tervalo cerrado cualquiera que contehga los puntos x 0 , x u ..., x„, y x. Si f posee 
derivada de orden n + \ en el intervalo [<*, /9] existe por lo menos un punto c 
en el intervalo abierto (a, / 8 ) tal que 

(15.14) = 

(n + 1)! 

donde 

A(x) = (x- x 0 )(x - xj) • • • (x - x„). 

Observación. E1 punto c depende a la vez de x y de n. 

Demostración. Si x es uno de los puntos de interpolación x k , entonces 
Mx k ) = 0 y la ecuación (15.14) se satisface para cualquier c en («, fi). Supon- 
gamos, pues, que x no es ninguno de los puntos de interpolación. Mantengamos 
fijo x y defìnamos una nueva función F en \a, /3] mediante la ecuación 

(15.15) F(t) = A(x)\f(t) - P(t)] - A(t)[f(x) - P(x)] . 

E1 segundo miembro de la ecuación, como función de t, posee derivada de orden 
n + 1; luego lo mismo le ocurre al primer miembro. Puesto que P(t) es un poli- 
nomio en t de grado ^ n, su derivada (n + l)-ésima es idénticamente nula. E1 
polinomio A(t) es de grado n + 1 , siendo el término de mayor grado t n+1 , y te- 
nemos A (n+ 1 ) (í) = (n + 1)!. Por lo tanto, si derivamos la ecuación (15.15) n + 1 
veces respecto a t obtenemos la fórmula 

(15.16) F<"+n(í) = A(x)f<"+»(t) - (« + 1)! | f( x ) - P(x)]. 

De la defìnición que se da en la ecuación (15.15) vemos que F tiene el valor cero 
en los n + 1 puntos de interpolación x„, x lt .... x„, y también en el punto x. 
Por consiguiente, F(t) = 0 en n + 2 puntos distintos del intervalo [«,£]. Esos 
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puntos determinan n + 1 subintervalos consecutivos de [«,/?] y la función F se 
anula en los dos extremos de esos subintervalos. Según el teorema de Rolle, la 
derivada F'(t) debe anularse por lo menos en un punto t interior a cada subinter- 
valo. Si elegimos exactamente uno de tales puntos t en cada subintervalo obtene- 
mos n + 1 puntos distintos en el intervalo abierto («, P) en los que F'(f) = 0- 
Esos puntos, a su vez, determinan n subintervalos en cuyos extremos tenemos 
F'(í) = 0. Aplicando el teorema de Rolle a F' encontramos que la derivada se- 
gunda F"(f) es cero por lo menos en n puntos distintos de («, /3). Aplicando reite- 
radamente el teorema de Rolle n + 1 veces de ese modo encontramos fmalmente 
que existe por lo menos un punto c en (a, /3) en el que F ( " +,) (c) = 0. Sustitu- 
yendo este valor de c en la ecuación (15,16) obtenemos 

(n + 1)! [f(x) - P(x)] = A(x)f< n+lì (c), 
que coincide con (15.14). Con lo que queda demostrado el teorema. 

Debe observarse que, al igual que en la aproximación con polinomios de Tay- 
lor, el término que da el error contiene la derivada (n + l)-ésima / (n+,) (c) calcu- 
lada en un punto desconocido c. Si se conocen los valores extremos de / (n+,) en 
[ot, /Sj, se pueden obtener cotas superior e inferior del error. 

Supongamos ahora que los puntos de interpolación están igualmente separa- 
dos y que x 0 < x% < x 2 < ... < x». Si h representa la distancia entre cada dos 
consecutivos podemos escribir 

Xj — Xq + jh y x = x 0 + th , 

donde t = (x - x 0 )/h. Ya que x - Xj = (t - j)h, el polinomio A(x) puede escri- 
birse en la forma siguiente 


A(x) = TT ( x — x i) — h ” +1 TT(í- j) ■ 

i=0 í=« 

La fórmula (15.14) se transforma ahora en 

(15.17) /W - p (*) = [ n + h ” +1 2 (í “ j) ’ 

con t = (x — x 0 )/h. 

ejemplo. El error en la interpolación lineal. Supongamos que una fun- 
ción / con derivada segunda está tabulada y que deseamos estimar su valor en un 
punto x intermedio entre los dos consecutivos x 0 y x 0 + h - si hacemos uso de la 
interpolación lineal aproximamos la gráfìca de / en el intervalo [x 0 , x„ + h) por 
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una recta, como muestra la figura 15.1. Si P es el polinomio de interpolación de 
primer grado, el error estimado en (15.17) es ahora 

(15.18) f(x) - P(x) = h 2 t(t - 1), 

donde t = (x — x a )/h. Cuando x está situado entre x 0 y x 0 + h tenemos 0<í< 1 
y el valor máximo de [í(í — 1)| en este intervalo es Por consiguiente (15.18) 
nos da la estimación 


|/(x)-P(x)|^ l/,,(C 8 }l h \ 



Figura 15.1 Interpolación lineal. 


E1 punto c es un punto desconocido en el intervalo (x 0 , x 0 + h). Si la derivada 
segunda f" está acotada en ese intervalo, l/"(x)| ^ M, la estimación del error es 

\f(x) - P(x)\ < ~. 

En particular, si / es un seno o un coseno; entonces \f"(x)\ ^ 1 para todo x 
y tenemos \f(x) — P(x)\ ^ h 2 /8. Con una tabla de senos o cosenos con intervalos 
de grado en grado (un grado = ■"■/! 80 radianes) tenemos /i = tt/ 180, así que 

h 2 7T 2 10 1 

8 “ 8(180) 2 ^ 259,200 ^ 25,000 “ 0 00004 ' 
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Ya que este error no excede a % en la cuarta cifra decimal, la interpolación 
lineal en una tabla de cuatro cifras decimales sería satisfactoria. E1 error esti- 
mado puede mejorarse en las partes de la tabla en donde | f"(c)\ sea menor que 1. 

15.9 Ejercicios 

1. En cada caso encontrar el polinomio P de menor grado que satisfaga las condiciones 
dadas. 

a) P(-l) = 0, P( 0) = 2, P(2) = 7. 

b) P(l) = 1, P(2) = 0, P( 3) = 0, P(4) = 1. 

c) P(l) = 1, P(2) =2, P( 3) = 3, P(0) = 1. 

d) P( 0) = -2, P(l) =0, P(-l) = -2, P(2) = 16. 

e) P( —2) = 11, P(-l) = -11, P(0) = -5, P(l) = -1. 

2. Sea f(x) = cos (ttx/ 4). Hallar el polinomio de menor grado que toma los mismos valores 
que / en los puntos —2, —f, 0,f, 2. 

3. Sean P un polinomio de grado <n y A(x) = (x — x 0 ) (x - xi) ...(x - x„), siendo 
xo,xi,... ,x„, n + 1 puntos distintos. 

a) Demostrar que cualquiera que sea el polinomio B el polinomio Q dado por 
Q(x) = P(x) + À(x)B(x) coincide con P en los puntos x 0 , xi, ..., x„. 

b) Probar también el recíproco. Esto es, si Q es un polinomio cualquiera que coin- 
cide con P en los puntos x 0 ,xi, ...x„, Q(x) = P(x) + A(x)B(x) para un cierto polinomio B. 

4. a) Hallar el polinomio Q de menor grado que satisfaga las condiciones 

Q(—2) = —5, G(-l) = -1, 0(1)-1,. G'(0) = -1. 

[Indicación: Hallar primero el polinomio P que tome los valores prescritos en 
—2, —1, 1, y utilizar luego el ejercicio 3 para determinar Q.] 
b) Hallar el polinomio Q de menor grado que satisfaga ias condiciones de la parte a) 
con Q'(0) = —3 en lugar de Q'(0) = — 1. 

5. Sea f(x) = logi x para x > 0. Calcular P(32), siendo P el polinomio de menor grado 
que coincide con / en los puntos: 

a) x = 1, 64. c)x=4, 16,64. 

b) x = 1,16,256. d) x = 1,4,16,64,256. 

Calcular en cada caso la diferencia /(32) — P(32). Estos ejemplos prueban que la preci- 
sión en la interpolación por polinomios no se mejora necesariamente aumentando el 
número de puntos de interpolación. 

6. Los coeficientes de interpolación de Lagrange L k (x) dados por la ecuación (15.10) depen- 
den nc solamente de x, sino también de los puntos de interpolación x 0 ,xi,... ,x„. Esta 
dependencia podemos indicarla escribiendo L*(x) = L t (x;X), dondeA' representa el vector 
del espacio E„ + i dado por X = (x 0 , Xi, ..., x„). Para un número real dado b, represente- 
mos con b el vector de E „+1 cuyos componentes son todos iguales a b. Si a -A 0, de- 
mostrar que 


L k (ax + b; aX + b) = L k (x; X). 

Ésta es la llamada propiedad de invarìancia de los coefìcientes de interpolación de La- 
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grange. E1 ejercicio siguiente nos hace ver la utilidad de esta propiedad para simplificar 
los cálculos. 

7. Sea P el polinomio de grado <4 que toma los valores 

P(2.4) = 72, />(2.5) = 30, />(2.7) = 18, />(2.8) = 24, />(3.0) = 180. 

a) Introducir nuevos puntos de interpolación u t ligados a los dados X) por la ecuación 
Uj = lOjtj — 24. Los Uj son enteros. Para cada k = 0,1,2,3,4, determinar los coeficientes 
de interpolación de Lagrange L t (x) en función de u, siendo u = 10* — 24. 

b) Utilizar la propiedad de invariancia del ejercicio 6 para calcular P(2,6). 

8. Una tabla de la función f(x) = log x contiene entradas desde x = 1 hasta x = 10 a inter- 
valos de 0,001. Los valores intermedios a cada par de entradas consecutivas se han calcu- 
lado mediante interpolación lineal. Supongamos que las entradas en la tabla son exactas. 

a) Demostrar que el error en la interpolación lineal no excederá a en la sexta cifra 
decimal. 

b) iPara qu é valores de x será satisfactoria la interpolación lineal para una tabla de 
siete cifras? 

c) tCuál debería ser la separación de las entradas en el intervalo 1 < x < 2 de modo 
que la interpolación lineal sea satisfactoria en una tabla de siete cifras? 

En los ejercicios del 9 al 15, xo,xi,...,x„ son puntos distintos y 


AM=fl (*-*,)> A k ( X )=J\( x - Xj) , Láx) -£M 

i=0 J-0 A kV x k) 

i*k 

9. Deducir la fórmula A'(x) = 2it=o A k (x) mediante el uso, a) de la derivación logarít- 
mica, b) de la fórmula de interpolación de Lagrange. 

10. Demostrar cada una de las fórmulas siguientes: 

a) ^ = 1 y 2^1 = ° Pafa t0d ° X ‘ 

fc =0 

b) "V —77— -v = 0. [ Indicación: Utilizar la parte a) con valores de x convenientes.] 

iÉo A ' Xk 

11. Sea P un polinomio cualquiera de grado < n. Demostrar que el coefìciente de x' 
es igual a 

y P(Xk) 

Û A '^ y 

12. a) Determinar a y b de modo que el polinomio 

P k (x) = {« + b(x - x k )}L k (xf 


tenga las siguientes propiedades: 

PjciXj) = 0 para todo /, P' k ( x ù = 1. 


y P k ( x i) = 0 para i * k. 
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b) Determinar c y d de modo que el polinomio 

Qk(x) = {c + d(x - x k )} L k ( x ) 2 
tenga las siguientes propiedades: 

Qk(x k ) = 1, QiAxJ = 0 para i k, y Q' k (x,) = 0 para todo i. 

c) Sea H(x) = 2it=o f( x k )Q k (x) + 2"=o f ( x k )P k (x) donde f es una función dada 
derivable en xn, xt, ..., x„. Demostrar que 

H(xd = f( Xi ) y H'(x t ) = f'( Xi ) para todo i. 

Demostrar también que existe a lo más un polinomio H(x) de grado <2n + 1 con esa 
propiedad. 

13. Dados n + 1 puntos distintos xo.xi ,... ,x„, sean P y Q dos polinomios de grado <n 
que satisfagan las n + 1 condiciones 

P(x a ) = Q(x 0 ), P'( Xl ) = Q'( Xl ), P’’(x 2 ) = Q"( Xi ), ..., pM( Xn ) = QM(x n ). 


Demostrar que P(x) = Q(x) para todo x. 
b) Sea Bo(x) = 1, y para n > 1 definimos 


B n (x) ■= 


*(* - n)" -1 

n! 


Demostrar que B'„(x) = — 1) para n > 1 y deducir que 

B n ( 0) = B;(l) = ^(2) = • • • = B\?-»(n - 1) = 0 y B ( „ n) (n) = 1 . 


c) Demostrar que el único polinomio de grado <n que satisface las condiciones 

P(0) = c 0 , P'( 1) = c lt P"( 2) = c 2 , .... P(”>(n) = c„ 

viene dado por n 

P(x) =Ì c k B k (x). 

k =0 


d) Si x t = xo + kh para k = 0,1,2,..., n, donde h > 0, generalizar los resultados de 
b) y c). 

14. Suponiendo que x 0 , xu... ,x„ son enteros que satisfacen x 0 <xt < ... < x„. 
a) Demostrar que \A'(x k )\ >k\(n — k)\ y deducir que 

V 1 2» 

Z\A'(x k )\ *nl‘ 
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b) Sea P un polinomio cualquiera de grado n, cuyo término de mayor grado es igual 
a x". Sea M el mayor de los números |P(*o)|. |P(->fj)!. ■ • •, |P(x n )|. Demostrar que 
AÍ>n!/2\ [Indicación: Utilizar la parte a) del ejercicio 11.] 

15. Demostrar las siguientes íórmulas. En las partes a) y b), x es un punto cualquiera dis- 
tinto de xo, *i, .... x». 


A(x) f 1 
A'(x) Z, ( x - Xj ) 2 ' 


16. Sea P n (x) el polinomio de grado <n que coincida con la función f(x) = e ax en los n + 1 
enteros x = 0, l,...,n. Puesto que ese polinomio depende de a lo designaremos por 
P.(x; d). Demostrar que el límite 


--ŷ—• 

) ^-iX -X, 


,, A‘(X) = A k (x) -ŷ 1 Ŷ 1 
A'(x) A'(x) ZnX-Xj ZsX-Xj ' 


c) ^ =2 jr_L_. 

A'(x k ) Ax k -Xj 


lim 
a—-0 


P n (x; a) - 1 


existe y es un polinomio en x. Determinar explícitamente dicho polinomio. 


15.10 Fónnula de interpolación de Newton 

Representemos con P„ el polinomio de interpolación de grado — n que coin 
cide con una función dada / en n + 1 puntos distintos x 0 , x u ..., x„. La fórmula 
de interpolación de Lagrange nos dice que 

P n (x) =| L k (x)f(x k ), 

donde Lk(x) es un polinomio de grado n (el coeficiente de interpolación de La- 
grange) dado por el producto 

(15.19) L k (x) = f\ x ~ Xí , para fc = 0,1, 2,. . ., n . 

o x k — x, 

ì*ì t 

Supongamos que anadimos un nuevo punto de interpolación x„+i a los dados 
x„, x u ..., x n . Para determinar el polinomio correspondiente P„+i con la fórmula 
de Lagrange es necesario calcular un nuevo coeficiente de interpolación L „+1 y 
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recalcular todos los coeficientes anteriores L 0 , L,, ..., L„, cada uno de los cuales 
es ahora un polinomio de grado n + 1. En la práctica esto supone un trabajo 
considerable. Por consiguiente, es conveniente disponer de otra fórmula para de- 
terminar P,„ que permita una más fácil transición de P„ a P n+1 . Tal fórmula 
la descubrió Newton; la deduciremos a partir del teorema siguiente. 

teorema 15.4. Dados n + 2 puntos distintos x 0 , x lt ..., x„, x„ +1 . Sea P„ 
el polinomio de grado ^ n que coincide con una función dada f en x 0 , .... x„, 
y sea P„+i el polinomio de grado — n + 1 que coincide con f en x 0 , x u ...» 
x„, x„ +1 . Existe entonces una constante c„+i, determìnada con unicidad por f y 
por los puntos de interpolación x 0 , ..., x n+1 tal que 

(15.20) P n +i(x) = P„(x) + c n+1 (x - x 0 ) • • • (x - x n ). 

Demostración. Pongamos Q(x) = P„(x) + c(x — x 0 )... (x — x„), donde c 
es una constante no determinada. Entonces Q es un polinomio de grado ^ n + 1 
que coincide con P„ y por tanto con / en cada uno de los n + 1 puntos x 0 , ..., x„. 
Elijamos luego c de modo que Q coincida también con / en x n+1 . Esto exige 

/(X n+l) = P„(x„+ 1 ) + c(x n+1 - x 0 ) • • • (x n+1 - x n ). 

Puesto que el coeficiente c no es nulo, esta ecuación tiene una sola solución que 
Uamamos c„ +1 . Tomando c = c«+i vemos que Q = P„+ u 

E1 teorema que sigue expresa P„(x) en función de los números c u .... c«. 

TEOREMA 15.5. FÓRMULA DE INTERPOLACIÓN DE NEWTON. Si X 0 , . . . , X„ 
son distintos, tenemos 


(15.21) p n ( x ) = f(x 0 ) + J>*(x - x 0 ) • • • (x - x*_j). 

Demostración. Definamos P 0 (x) = f(x 0 ) y tomemos n = 0 en (15.20) ob- 
teniendo 

=/(+>) + cfx - x 0 ). 

Hagamos ahora n = 1 en (15.20), con lo que conseguimos 

Pfx) = Pfx) + c 2 (x - x 0 )(x - xj =/(x 0 ) + cfx - x 0 ) + c 2 (x - x 0 )(x - xj. 


Por inducción, obtenemos (15.21). 

La propiedad de la fórmula de Newton expresada en la ecuación (15.20) 
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nos permite calcular P„ +1 con sólo sumar un nuevo término a P„. Esta propiedad 
no la posee la fórmula de Lagrange. 

La utilidad de la fórmula de Newton depende, naturalmente, de la facili- 
dad con la que puedan calcularse los coeficientes c„ c 2 , ..., c„. E1 teorema que 
sigue demuestra que c„ es una combinación lineal de los valores /(x 0 ), ..., f(x„). 

teorema 15.6. Los coeficientes de la fórmula de interpolación de Newton 
vienen dados por 

(15.22) donde 4*(**) = ít (**-%>• 

Úo Al ^ Xk) ìtl 

Demostración. Según la fórmula de Lagrange tenemos 


PAx)=ÏL k (x)f(x k ), 

*=o 

en donde Lk(x) es el polinomio de grado n dado por (15.19). Puesto que el coe- 
ficiente de x n en L k (x) es 1/A k (x k ), el coeficiente de x n en P„(x) es la suma que 
aparece en (15.22). Por otra parte, la fórmula de Newton demuestra que el coefi- 
ciente de x n en P„(x) es igual a c„. Esto completa la demostración. 

La ecuación (15.22) nos proporciona un método directo para calcular los 
coeficientes de la fórmula de Newton. Los números A k (x k ) aparecen también 
como factores en el denominador del coeficiente de interpolación de Lagrange 
L k (x). La sección que sigue describe otro método para calcular los coeficientes 
cuando los puntos de interpolación están igualmente separados. 

15.11 Puntos de interpolación igualmente separados. E1 operador de las diferen- 
cias sucesivas 

En el caso de puntos de interpolación igualmente separados x k = x 0 + kh 
para k = 0, 1, ..., n podemos utilizar la ecuación (15.12) obteniendo 


-L- = fr—J— = J-TT-J_ = (~ 1)w 

A k (x k ) i=o x k — Xj h n i=o k — j n \ h n \k) 


En este caso la fórmula que da c„ del teorema 15.6 se transforma en 
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La suma del segundo miembro puede calcularse de otra manera en función de 
un operador lineal A llamado operador de las diferencias sucesivas. 

definición. Sean h un número real fijo y f una función dada. La función 
A/ definida por la ecuación 


A/W =f(x + h) -f(x) 

se llama la diferencia primera de f. Está definida para aquellos puntos x para los 
que tanto x como x + h están en el dominio de f. Las diferencias de órdenes 
superiores A*/, A a f, ... se definen por inducción como siguen: 

A*+/ = A(A*/) para k = 1,2,3,.... 


Observación. También se emplean las notaciones A,,/(jc) y A/(x; h) cuando sc 
quiere indicar la dependencia de h. Es conveniente definir A°/ = /. 

La n-ésima diferencia A n f(x) es una combinación lineal de los valores f(x), 
f(x + h), ...,/(* + nh). Por ejemplo, tenemos 

A s /« = {f(x + 2 h) -f(x + h)} - {f(x + h) -/(*)} 

=f(x + 2 h) - 2f(x + h) +/(*). 

En general, tenemos 

(15.24) A-/(*) =2(-l)"“*tì/(^ + **)■ 

*=0 ' ' 

Esto se demuestra fácilmente por inducción respecto a n, utilizando la ley del 
triángulo de Pascal para los coeficientes binomiales: 

(fc - l) + (fc) = (" k ^) ' 

Supongamos ahora que / esté definida en n + 1 puntos igualmente separa- 
dos Xk = x 0 + kh para k = 0, 1, Entonces de (15.23) y (15.24) obte- 

nemos la fórmula 

c„ = ^A ”f(x 0 ). 


Esto proporciona un método rápido para calcular los coeficientes de la fórmula 
de interpolación de Newton. E1 diagrama de la tabla 15.1, llamado tabla de di- 
ferencias, hace ver cómo las diferencias sucesivas pueden calcularse sistemáti- 
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camente a partir de una tabulación de los valores de / en los puntos igualmente 
separados. En la tabla se ha escrito fk en lugar de f(x k ). 

La fórmula de interpolación de Newton (15.21) toma ahora la forma 

05.25, F„«=/M + gff 11 (*-*,)• 


Tabla 15.1 



tf (« - *,) - TT(* - x.-jh) - **TT- j) - í*tî« -n. 

en donde t = (x — x 0 )/h, la ecuación (15.25) se convierte en 
(15.26) P n (x) = /(x 0 ) + J H (í - j) ■ 


15.12 Polinomios factoriales 


Si k es un número natural, el producto t(t — 1) ... (t — k + 1) es un poli- 
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nomio en í de grado k llamado polinomio factorial &-ésimo. Se representa con el 
símbolo t lk) . Así pues, según la definición, 

í<k>= S (í_j) ‘ 

Definimos también f (0) = 1. Si consideramos el operador A de las diferencias su- 
cesivas con h = 1, es decir, A/(x) = f(x + 1) - f(x), encontramos que 

Aí<"> = i) p ara n ^ i. 

Es una fórmula del mismo tipo que la de la derivación ordinaria de potencias 
Dt n = nt n ~ \ Con lo cual vemos que el polinomio factorial f (n) está relacionado 
con las diferencias del mismo modo que las potencias ordinarias t n lo están con 
las derivadas. 

Con el uso de los polinomios factoriales, la fórmula de interpolación de 
Newton (8.65) se convierte en 

P n (x 0 + th) =Ỳ^7T ~t <k> - 

k-0 k • 

Puesta en esta forma, la fórmula de Newton se parece a la de Taylor para el 
polincmio de grado ^ n que coincide con / y sus n primeras derivadas en x 0 . Si 
escribimos 

/í\ f^ = f(f - 1) • • • (f - k + 1) 

\k) kl k\ 

la fórmula de Newton toma la forma 

p n (x 0 +m =2(fc) 

k=0 ' ' 

En los ejercicios que siguen se exponen otras propiedades de los polinomios fac- 
toriales. 

15.13 Ejercicios 

1. Sea A f(x) = f(x + h) — f(x). Si / es un polinomio de grado n, 

/W = 2 o fl r* r 
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con a„ 0, demostrar que á) A k ](x) es un polinomio de grado n—k si k<n; b) A "](x)= 
= n\h'a„; c) A k ](x) = 0 para k > n. 

2. Sea A f(x) = í(x + h) — f(x). Si ](x) = sen (ax + b), demostrar que 


A"/(jc) = 2se 


nah + mr\ 

)■ 


3. Sea A](x) = f(x + h) - f(x). 

a) Si f(x) = a’, siendo a > 0, demostrar que & f(x) = (a n - 1 ) a*. 

b) Si g(x) = (1 +a)V*, siendo a > 0 demostrar que A k g(x) =a k g(x). 

c) Demostrar que el polinomio P „ de grado n que toma los valores P „( k ) = (1 + a) k 
para k = 0,1,2,..., n viene dado por 



4. Sea x(') el n-ésimo polinomio factorial en x. Puesto que xC*> es un polinomio 
grado n con el valor 0 cuando * = 0, podemos escribir 


de 


* <n) = 1 ^- 

Los números S k ,„ se llaman números de Stirling de primera especie. De la defmición de 
a(") resulta evidente que S„.„ = 1 para n > 0. 

a Demostrar que S„. i,„ = —n(n ~ l)/2 y que Si,„ = (~l)*-i(n - 1)! para n > 1. 
b) Demostrar que S»,„+i = — nS k ,„. Comprobar esta relación en la tabla 15.2, de 

números de Stirling de primera especie, y construir las tres filas siguientes de la tabla. 


-50 

274 


c) Expresar el polinomio x( 4 ) + 3x< 3 > + 2x( l ) + 1 como combinación lineal de potencias 
de x. 

5. a) Demostrar que 


+ x< 2 >, x> = 


+ 3jc< 2 > + x< 3 >, 
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y que, cn general, 


Z- *! 


donde f(x) = x" y A f(x) = f(x + 1) - f(x). Los números T k .„ = Mf(0)/k\ se llaman nú- 
meros de Slìrling de segunda especie. 

b) Demostrar que 


A^n+i = ( x + k) à k x n + k A k l x n 
y con ello deducir que T t .„ + i = + kTk.„. 

c) Comprobar la tabla 15.3 de números de Stirling de segunda especie, con la fórmula 
de recurrencia de la parte b), y construir las tres fìlas siguientes de la tabla. 


Tabla 15.3 


n 

Ti. n 

Tì.n 

r 3> „ 

T 4 , n 

T b .„ 

t 6 .„ T 7i „ 

1 

2 

1 

1 

1 





3 

1 

3 

1 




4 

1 

7 

6 

1 



5 

1 

15 

25 

10 

1 


6 

1 

31 

90 

65 

15 

1 

7 


63 

301 

350 

140 

21 1 


d) Expresar el polinomio x 4 + Zx s + 2x — 1 como una combinación lineal de polino- 
mios factoriales. 

6. a) Si p es un número natural y a y b son enteros tales que a < b, demostrar que 


2 * w - 


Esta fórmula es análoga a la de la integraciónj* x v dx. Debe observarse, sin embargo, que 
el límite superior de la suma es b — 1, y no b. 

b) Comprobar que k(k + 3) = 4kW + k(‘ 2 ). Usar entonces la parte a) para demostrar que 


t k 


(« + 1)< 3 > n(n + l)(#i + 5) 
3 3 
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c) Si f(k) es un polinomio en k de grado r, demostrar que 

i m 

es un polinomio en n de grado r + 1. 

7. Con el método sugerido en el ejercicio 6 expresar cada una de las sumas siguientes 
como un polinomio en n. 

a) 2 (4fc 2 + lk + 6). c) J k(k + 1)(* + 2). 

k=l *!—1 

b) J i k\k + 1). d)2* 4 . 

*=1 k =1 

8. Designemos con A el operador lineal deíinido por la ecuación 

A(f) = a„ A n / + a x A"- 1 / + • • • + a n _ x A f + a n f, 

siendo oo, a x ,... ,a r constantes. Êste es el llamado operador diferencia de coeficientes 
constantes. Es análogo al operador derivada de coeficientes constantes descrito en la sec- 
ción 6.7. A cada uno de tales A podemos asociar el polinomio característico p A defini- 
do por 

p A (r) = a 0 r n + a x r n ~ 1 + • + a n _ x r + a n . 

Recíprocamente, a todo polinomio p podemos asociar un operador A del cual es polino- 
mio característico. Si A y B son dos operadores diferencia de coeficientes constantes y 
X es un número real fijo, definimos A + B, AB, y \A mediante Ias mismas fórmulas 
empleadas en la sección '6.7 para los operadores derivada. Demostrar entonces que el 
teorema 6.6 es válido para operadores diferencia de coeficientes constantes. 


15.14 Problema de mínimo relativo a la norma del máximo 

Consideremos un problema que se presenta espontáneamente en la teoría de 
la aproximación por polinomios. En el teorema 15.3 se dedujo la fórmula del 
error 

(15.27) /W-P W --2ÍíiL- / '.« W , 

(n + 1 )! 

en donde 

A(x) = (x - x 0 )(x - x x ) ■ ■ ■ (x - x n ). 

Aquí P es el único polinomio de grado ^ n que coincide con / en n + 1 puntos 
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distintos x n , Xi , .... x n en [a, &]. La función / se supone con derivada de orden 
n + 1 en [a, &], y c es un punto desconocido situado en [a, &]. Para estimar 
el error en (15.27) son necesarias cotas para la derivada / (n+1) y para el producto 
A(x). Como A es un polinomio, su valor absoluto posee un máximo en algún 
punto del intervalo [a, 6]. Este máximo dependerá de la elección de los puntos 
x 0 , Xi , .... x„, y es natural procurar elegir esos puntos de manera que la nor- 
ma A sea la menor posible. 

Podemos designar ese máximo por ||A[|, donde ||A|[ es la norma del máxi- 
mo, dada por 


Mll =maxJX(x)|. 


E1 problema consiste en encontrar un polinomio de grado asignado que haga 
mínimo [|A[|. E1 primero en resolver este problema fue Chebyshev; su solución 
conduce a una clase interesante de polinomios que también se presentan en otras 
cuestiones. Primero daremos una breve noticia sobre esos polinomios y luego 
volveremos al problema de mínimo indicado. 

15.15 Polinomios de Chebyshev 

Sea x + iy un número complejo de valor absoluto 1. En virtud del desarro- 
llo de Newton tenemos 


(* + iy y =2(j)x"-*(í iyf 

Jr =0 ' ' 

para todo entero n^ 0. Hagamos en esta fórmula x = cos 9, y = sen 9, y con- 
sideremos la parte real de cada miembro. Puesto que 

(x + iỳ) n = (cos 0 + i sen 6) n = e in9 = cos nO + i sen nO , 


identifìcando esas dos partes tenemos 


(15.28) cos nd = x n — (")x” 2 y 2 + (^j)*" -4 / -+•••. 

Ya que y 2 = sen 2 0 = 1 — cos 2 0 = 1 — x 2 , el segundo miembro de (15.28) es 
un polinomio en x de grado n. Ese polinomio es el polinomio de Chebyshev de 
primera especie y se designa con T„(x). 
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definición. El polinomio de Chebyshev T„(x) se dejine para todo x real 
por medio de la ecuación 



De la igualdad (15.28) obtenemos el teorema siguiente. 

teorema 15.7. Si — 1 ^ x ^ 1 entonces tenemos 
T„(x)= cos (n arc cos *) . 

Demostración. Si 6 = arc cos x entonces x = cos 9 y T„(x) = cos nd. 

Los polinomios de Chebyshev pueden calcularse rápidamente tomando la 
parte real de (x + iy)" poniendo ỳ 2 = l — x 2 , o utilizando la siguiente fórmula 
de recurrencia. 

teorema 15.8. Los polinomios de Chebyshev satisfacen la siguiente fórmula 
de recurrencia 


T n+1 (x) = 2 xT n (x) - T n _ x (x) para n> 1, 


siendo T 0 (x) = 1 y Tí(x) = x. 

Demostración. Supongamos primero que — 1 ^ x ^ 1 y pongamos x = cos 9 
en la identidad trigonométrica 

cos (n + 1)0 + cos (n — 1)0 = 2 cos 0 cos nd. 

Esto demuestra que T„ +1 (x) + T„_^(x) = 2xT„(x) para x en el intervalo —1 =£ 
^ x ^ 1. Pero ya que ambos miembros son polinomios, esta relación debe ser 
válida para todo x. 

Los cinco polinomios siguientes son 

T 2 (x) = 2x 2 - 1 , T a (x) = 4jc 3 - 3x, T t (x) = 8x 4 - 8x 2 + 1, 

T 5 (x) = 1 6x r ' - 20x 3 + 5x, T e (x) = 32x* - 48x 4 + 18x 2 - 1 . 

La fórmula de recurrencia demuestra que todos los coefîcientes de T„(x) 
son enteros; además, el coefìciente de x n es 2 n_1 . 
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E1 teorema que sigue demuestra que T„(x) tiene exactamente n ceros de pri- 
mer orden situados todos en el intervalo [ — 1 , 1 ]. 

teorema 15.9. Si n ^ 1 el polinomio T„(x) tiene ceros en los n puntos 


(2 k + 1)77 

X,. = cos-— , 

2 n 

Luego T„(x) admite la jactorización 
T n (x) = 2 n ~\x - Xq)(x - Xj) • • • (x - 


= 2”- 1 n ( 


is ( 2 k±lt 

2 n 


Demostración. Usamos la fórmula T„(x) = cos nd. Puesto que cos n9 — 0 
sólo si nO es un múltiplo impar de ir/2, tenemos T„(x) = 0 para x en [ — 1,1] 
únicamente si n arc cos x = (2 k + 1)tt/ 2 para un cierto entero k. Por tanto, los 
:eros de T» en el intervalo [ — 1,1] se encuentran entre los números 

2k + 1 77 

(15.29) x* = cos—— -, fc = 0, ±1, ±2,.... 

n 2 

Los valores fc = 0, 1, 2, ..., n — 1 dan n ceros distintos x 0 , x u .... x„-i, si- 
tuados todos en el intervalo abierto ( — 1,1). Puesto que un polínomio de gra- 
do n no puede tener más de n ceros, ésos deben ser todos los ceros de T„. Los 
restantes Xk de (15.29) son repeticiones de esos n. 

teorema 15.10. En el intervalo [ — 1,1] los valores extremos de T„(x) son 
+ 1 y — 1, alcanzados alternativamente en los n + 1 puntos 

(15.30) h = cos ~ > P ara fc = 0, 1, 2. n. 

Demostración. Según el teorema de Rolle, el máximo y el mínimo relati- 
vos de T» deben presentarse entre dos ceros consecutivos; existen n — 1 puntos 



Figura 15.2 Gráficas de polinomios de Chebyshev en el intervalo [ — 1,1]. 
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de tal naturaleza en el intervalo abierto ( — 1,1). En la fórmula del coseno para 
T„ vemos que los valores extremos, ±1, son alcanzados en los n — 1 puntos 
interiores cos (JcTr/n), k = ì, 2, n — 1, y también en los extremos x = 1 
y x = —1. Por consiguiente, en el intervalo cerrado [ — 1,1] los valores extre- 
mos +1 y — 1 son alcanzados alternativamente en los n + 1 puntos í 0 , t u ..., t„ 
dados por tk = cos ( k-rr/n) para k = 0, 1 , 2, ..., n. 

La fìgura 15.2 representa las gráficas de T 2 , ..., T s en el intervalo [ — 1, 1]. 

15.16 Propiedad de mínimo de los polinomios de Chebyshev 

Volvamos ahora al problema de encontrar un polinomio de grado prefìjado 
para el que la norma del máximo sea lo más pequena posible. E1 problema se 
resuelve con el siguiente teorema. 

teorema 15.11. Sea p„(x) = x n + ... un polinomio cualquiera de grado 
n ^ 1 con primer coeficiente igual a 1, y pongamos 

llpJI = max |p„(x)|. 

Tenemos entonces la desigualdad 

(15.31) llpJI ^ llfj, 

en donde T n (x) = T„(x)/2 n ~ 1 . Además, la igualdad en (15.31) es válida si 
p n = T n . 

Demostración. En el intervalo [ — 1,1] el polinomio f n toma sus valores 
extremos, l/2 n_1 y —1/2” -1 , alternativamente en los n + 1 puntos distintos tk 
de la ecuación (15.30). Por consiguiente, ||f n || = 1/2" -1 . 

Demostremos a continuación que la desigualdad 

d 5 ' 32 ) II Pn II < 

nos lleva a una contradicción. Supongamos que p„ satisfaga (15.32) y considere- 
mos la diferencia 


r(x) = T n (x) - p n (x ). 

En los puntos tk dados por (15.30) tenemos 

r(t k ) = - Pn(t k ) = - (-D*P B (tt)] • 
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Debido-a (15.32) el factor entre corchetes es positivo. Por consiguiente, r(t k ) tiene 
signos alternados en los n + 1 puntos í„, t u ..., t„. Puesto que r es continua 
debe anularse por lo menos una vez entre dos cambios de signo consecutivos. 
Por consiguiente, r tiene por lo menos n ceros distintos. Pero como r es un po- 
linomio de grado ^ n — 1, esto signifìca que r es idénticamente nula. Por lo tan- 
to, P„ = T„, así que ||P„|| = ||î’ n || = l/2 n_1 , en contradicción con (15.32). Esto 
demuestra que debe ser ||p„|| ^ 1/2 B_1 = || T n ||. 

Aunque el teorema 15.11 hace referencia al intervalo [ — 1,1] y a un poli- 
nomio con primer coeficiente 1, puede también utilizarse para deducir un resul- 
tado análogo para un intervalo cualquiera [a, 6] y un polinomio cualquiera. 

teorema 15.12. Sea q„(x) = CrX n + ... «« polinomio de grado n^l, 
y pongamos 


Il4nll = max k„(x)|. 
Tenemos entonces la desigualdad 

, (b - a)" 


(15.33) 


lk„ll ^ k,| - 


2 2 ” -1 


Además, la igualdad en (15.33) es válida si 

Demostración. Consideremos la transformación 
2x — a — b 




b — a 


Ésta aplica el intervalo a ^ x ^ b en forma uno a uno sobre el intervalo 
— 1 ^ t ^ 1. Puesto que 


b — a b + a 


luego 


x" = ^ í” + términos de grado inferior 

q„(x) = Pn ®’ 
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en donde p„(t) es un polinomio en t de grado n con primer coeficiente 1. Apli- 
cando el teorema 15.11 a p„ obtenemos el teorema 15.12. 

15.17 Aplicación a la fórmula del error en la interpolación 

Volvamos ahora a la fórmula (15.27) del error en la interpolación por po- 
linomios. Si elegimos los puntos de interpolación x„, x,, ..., x„ de modo que 
coincidan con los n + 1 ceros del polinomio de Chebyshev T„ +1 podemos escri- 
bir (15.27) en la forma 


f(x) - P(x) = - / (B+1, (c). 

2 (n + 1)! 

Los puntos x 0 , x u ..., x„ están todos en el intervalo abierto ( — 1,1) y vienen 
dados por 

(2k + 1 w\ . . , . 

x k = cos I— — -j para k = 0,1 , 2, ..., n . 

Si x está en el intervalo [ — 1,1] tenemos |T« +1 (*)| ^ 1 y el error viene estimado 
por la desigualdad 

|/(x) - P(x)\ < - 1 |/ (B+1, (c)|. 

2 ”(n + 1)! 

Si la interpolación se efectúa en el intervalo [a, 6] con los puntos 



como puntos de interpolación, el producto 

A(x) = (x - y 0 )(x - • • • (x - y„) 

satisface la desigualdad |A(x)| ^ (b — a) n+1 / 2 2n+1 para todo x en [a, b ]. La esti- 
mación correspondiente para f(x) — P(x) es 

i/(*) - m i < l b „~ a) " + !(, i/ (n+1, wi ■ 

2 + (n + 1)! 


15.18 Ejercicios 

En este conjunto de ejercicios T„ representa el polinomio de Chebyshev de grado n. 

1. Demostrar que T„(—x) = (-1 )"T„(x). Esto demuestra que T„ es función par si n-es par 
y función impar si n es impar. 
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2. a) Demostrar que en el intervalo abierto ( — 1,1) la derivada T'„ viene dada por la 
fórmula 




0 = arc cos x . 


b) Calcular T„'(l) y T„'( —1). 


3. Demostrar que 




1 ÍW*) - T’nrt(O) 

2\ n + i 


T_ x (x) - T„_j(0)] 

j 


n > 2. 


4. a) Demostrar que 2T m (x)T n (x) = T m+n (x) + T m _ n (x). 
b) Demostrar que T mn (x) = T m [T n (xj] = T n [T m (x)\. 

5. Si * = cos 9, demostrar que sen 8 sen n8 es un polinomio en x, y determinar su grado. 

6. E1 polinomio de Chebyshev T„ satisface la ecuación diferencial 


(1 - x 2 )y - xy' +n 2 y = 0 

en todo el eje real. Demostrarlo con cada uno de los métodos siguientes: 

a) Derivando la relación T„'(x) sen 8 = n sen n$ obtenida en el ejercicio 2a). 

b) Introducir el cambio de varíable x = cosfl en la ecuación diferencial 


d 2 (cos nO) 

dÔ 2 


—n 2 cos nO. 


7. Determinar, en función de polinomios de Chebyshev, un polinomio Q(x) de grado <n 
de aproximación óptima para en el intervalo [ — 1, 1] relativo a la norma del 
máximo. 

8. Hallar un polinomio de grado <4 de aproximación óptima para la función f(x) = x 3 en 
el intervalo [0,1], relativo a la norma del máximo. 

9. Un polinomio P se llama primario o monario si el coeficiente del término de mayor 
grado es 1. Para un intervalo dado [a, b] designemos con ||P|| el máximo de \P\ en 
[a, î»]. Demostrar cada una de las siguientes afìrmaciones: 

a) Si b — a < 4, para todo e > 0 existe un polinomio monario P tal que ||P|| < e. 

b) Si para todo e > 0 existe un polinomio monaric P tal que |ÍP|| < e, entonces 
b — a < 4. Dicho de otro modo, los polinomios monarios con norma arbitrariamente 
pequena existen si, y sólo si, el intervalo [a, b] tiene longitud menor que 4. 

10. Los polinomios de Chebyshev satisfacen las siguientes relaciones de ortogonalidad: 


J- 1 y/l — X 2 


Demostrarlas por cada uno de los siguientes métodos: 
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a) A partir de la ecuación diferencial del ejercicio 6 deducir que 

Escribir la fórmula correspondiente intercambiando n y m, restar las dos ecuaciones, 
e integrar entre — 1 y 1. 

b) Utilizar las relaciones de ortogonalidad 



e introducir el cambio de variable x = cos «. 
11. Demostrar que para — 1 < x < 1 lenemos 


T n (x) 

y/l -X* 


(_l)n £— (1 _ 1/î 

V ’ (2nV.dx n( X ’ 


,.,y„ n números reales, y 
(2k - Dn 


para k = 1, 2. n. 


Sea P el polinomio de grado <« — 1 que toma el valor y* en x t para 1 < fe < n. Si x 
no es uno de esos x t demostrar que 




13. Sea P un polinomio de grado < n — 1 tal que 

Vr^iPMi ^ i 


para — 1 < x < 1. Demostrar que ||P|| < n, síendo ||P|| el máximo de |P| en el intervalo 
[ — 1,1]. [ Indicación: Utilizar el ejercicio 12. Considerar tres casos: xi < x < 1; 
— 1 < x < x„; x„ < x < xy, en los dos prim eros ha cer uso del ejercicio 15 a) de la sec- 
ción 15.9. En el tercer caso observar que ^J\ _ ^2 sen („/2n) > \/ n ] 

En los ejercicios del 14 al 18, U„(x) - T^ +1 (x)/(n + 1) para n = 0,1,2,... . 

14. a) Demostrar que U„(x) = 2xU„-\(x) — U„ ->(x) para n > 2. 
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b) Determinar la forma explícita de los polinomios l/o, lh,...,U i . 

c) Demostrar que |l/„(x)| < n + 1 si-1 <x<l. 

15. Demostrar que í/„ satisface la ecuación diferencial 


(1 — jc 2 )/' — 3 xy' + «(« + 2)y = 0. 


16. Deducir las relaciones de ortogonalidad 


J 1 y/í - jc 2 U m (x)U n (x) dx = 


17. Probar que 


(2« + 1)! dx n 

18. Sean yi,y 2 , « números reales y 

** = C ° S n + ì Para k = 1,2 . " ’ 

Sea P el polinomio de grado < « - 1 que toma el valor y* en para 1 < k < n. Si x 
no es uno de los Xt demostrar que 

U n (x) 




15.19 Integración aproximada. Regla de los trapecios 

Muchos problemas tanto de Matemática pura como aplicada nos conducen a 
nuevas funciones cuyas propiedades no han sido estudiadas o cuyos valores no 
han sido tabulados. Con frecuencia es necesario obtener información cuantitativa 
sobre tales funciones, bien en forma gráfica, bien en forma numérica. Muchas de 
esas funciones se presentan como integrales del tipo 

F(x) = jj(t) dt, 

en las que el integrando / viene dado por una fórmula analítica explícita o es co- 
nocida en parte por datos tabulados. E1 resto del presente capítulo se dedica a 
algunos de los más elementales métodos para encontrar aproximaciones numéricas 
de tales integrales. La idea básica es muy sencilla. Aproximamos el integrando / 
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mediante otra función P cuya integral es de fácil cálculo, y tomamos entonces la 
integral de P como aproximación de la integral de /. 

Si / es no negativa la integral f(x)dx representa el área del conjunto de 
ordenadas de / sobre [a, b]. Esta interpretación geométrica de la integral sugiere 
inmediatamente ciertos procedimientos de integración aproximada. La fìgura 15.3 
muestra un ejemplo de una función / con valores conocidos en n + 1 puntos igual- 
mente separados a, a + h, a + 2h, ..., a + nh = b, donde h = (b — a)/n. Sea 
Xk = a + kh. Para cada k = 0, 1, 2, ..., n — 1 la gráfica de / correspondiente 
al intervalo [xk, xt +a ] ha sido aproximada mediante una función lineal que coin- 
cida con / en los extremos Xk y Xk+i. Con P designemos la correspondiente función 
poligonal de interpolación definida sobre todo el intervalo [a, b]. Tenemos en- 
tonces 


(15.34) m .1 . 

Integrando en el intervalo [x k , x i+ i] encontramos que 
j Xk+1 P(x) dx = h ±p*î+Ù m 


Cuando / es positiva ésta es el área de un trapecio determinado por la gráfica de 
P sobre [x k , xt +1 ]. La fórmula es válida, naturalmente, incluso si / no es siem- 
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pre positiva. Sumando las integrales correspondientes a todos los subintervalos 
[ x k , x* + i] obtenemos 


JJ P(x) dx = ^ [/(**) + /(x* +1 )] 

= + 2 2/(« ++/w) • 


Para utilizar esta suma como una aproximación de la integral f(x)dx necesita- 
mos una estimación del error f(x)dx — P(x)dx. Si f posee derivada segunda 
continua en \_a, ò] este error viene dado por el siguiente teorema. 

teorema 15.13. regla de los trapecios. Si suponemos que f tiene de- 
rivada segunda f” continua en [a, ò] y si n es un número natural, pongamos 
h=(b—a)/n, entonces tenemos 

(15.36) JV(x) dx = ^-^/(a) + 22/(a + kh) +/(ò)) - ^=^/"(c) 
para un ciertò c en [a, 6]. 

Observación. La fórmula (15.36) es la regla de los trapecios. E1 término 
— f"(c)(b — a)' á /i2n 2 representa el error al aproximar f(x)dx por la J£ P(x) dx. 
En cuanto se conoce el valor máximo de /" en [ a, b ] podemos aproximar la integral 
de / con el grado de precisión que se desee sin más que tomar n sufìcientemente 
grande. Observemos que no se requiere el conocimiento de la función P para usar esa 
fórmula. Tan sólo necesitamos conocer los valores de / en los puntos a, a + h ,..., 
a + nh, y tener una estimación de |/"(e)|. 

Demostración. Sea P la función de interpolación dada por (15.34), donde 
x^ = a + kh. En cada subintervalo [x*, xi+i] aplicamos la estima del error para 
la interpolación lineal dada por el teorema 15.3 y encontramos 

(15.37) /(*) - = (x - x*)(x - x k+1 ) f -^à 

para un cierto Ck en (x k , x k +i). Sean M 2 y m 2 el máximo y el mínimo, respectiva- 
mente, de /" en [a, 6], y sea 

B(x) = (x - x*)(x* +1 - x)/2. 

Entonces B(x) ^ 0 en el intervalo [xt, xt +1 ], y de (15.37) obtenemos las desigual- 
dades 


m 2 B(x) <, P(x) -f(x) <, M 2 B(x) 
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en este intervalo. Integrando, tenemos 

(15.38) m 2 B(x) dx <, /** + * [P(x) - f(x )] dx <, M 2 j*j +h B(x) dx. 

La integral de B viene dada por 

| B(x) dx = ± j Xk+ \ x - Xk)(Xk+i - x)dx = j f t(h _ t)dt = ì?' 

JXk 2 Jo 12 

Por consiguiente, las desigualdades (15.38) nos dan 

JT** l p (x) - /(*)] dx <, M 2 . 

Sumando esas desigualdades para k = 0, 1, 2, n — ly dividiendo por n, 
obtenemos 

<. ^ J a [PW - /(*)] dx <, M t . 

Puesto que la función f' es continua en [a, b], alcanza cualquier valor compren- 
dido entre su mínimo m 2 y su máximo M 2 en algún punto de [a, b~\. En particu- 
lar, tenemos 

f"(c) = ^ a j\ p (x)-f(x)]dx 
para algún c en [a, b]. Dicho de otro modo, 

jj(x) dx = j Ò p(x) dx-~ f"(c). 

Con (15.35) y la relación h = (b — a)/n obtenemos (15.36). 

Para deducir la regla de los trapecios utilizamos un polinomio lineal para 
interpolar entre cada par de valores consecutivos de /. Se pueden obtener fórmu- 
las más precisas interpolando con polinomios de grado superior. En la próxima 
sección consideramos un caso particular importante notable por su simplicidad 
y precisión. 

15.20 Regla de Simpson 

La curva de trazo continuo de la figura 15.4 es la gráfica de una función / 
correspondiente al intervalo [a, b]. E1 punto medio del intervalo, (a + b)/2, se 
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representa con m. La curva de puntos es la gráfica de un polinomio cuadrático P 
que coincide con / en los tres puntos a, m y b. Si utilizamos la integral P(x)dx 
como una aproximación de J® f(x)dx vamos a parar a una fórmula de integración 
aproximada conocida con el nombre de regla de Simpson. 

En lugar de determinar P explícitamente, introducimos una transformación 
lineal que lleva el intervalo [a, 6] sobre el intervalo [0,2]. Si escribimos 

t = * ~ — , o x = a + (m — a)t, 
m — a 

vemos que t toma los valores 0, 1, 2 cuando x toma los a, m, b. Sea àhora 
<p(t) = P[a + (m — a)t]. 

Entonces <p(t) es un polinomio cuadrático en t que toma los valores P(a), P(m), 
P(b) en los puntos t = 0, 1, 2, respectivamente. También, tenemos 

f cp(t) dt = C P[a + (m- a)t ] dt = —Pi»(x) dx ; 

J o Jo m — a Ja 



J P(x) dx = (m — a) j <p(t) dt = ^ <p(t) dt. 


(15.39) 
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Utilicemos ahora la fórmula de interpolación de Newton para construir <p. 
Tenemos 


T(t) = qiO) + t A<r(0) + t(t - , 

donde A <p(t) = <p(t + 1 ) — <p(t). Integrando entre 0 y 2 obtenemos 

£ q>(t) dt = 2<p(0) + 2 A<K 0 ) + 4 AV( 0 ). 

Puesto que A(p(0) = f(l) — p(0) y A 2 y(0) = <p(2) — 2<p(\) + y>(0), la integral es 
igual a 

J/ <p(t) dt = 4fo(0) + 4<p(ì) + <p(2)] = i[P(a) + 4P(m) + P(b)]. 
Teniendo en cuenta (15.39) y que P coincide con / en a, m, b, obtenemos 

(15.40) £ P(x) dx = [f(a) + 4/(m) + f(b)]. 

Por consiguiente, podemos escribir 

[m dx = (f(a) + 4 f(m) + f(b )] + R , 

siendo R = /*/(*) dx - $ b a P(x) dx. 

Si / es polinomio cuadrático, P es idéntico a / y el error R es cero. También 
se observa que R = 0 cuando / es un polinomio cúbico. Para demostrarlo utiliza- 
mos la estimación de error para la interpolación de Lagrange dada por el teorema 
15.3, y escribimos 

(15.41) f(x) - P(x) = (x- a)(x - m)(x - , 

donde c e (a, b). Cuando / es un polinomio cúbico la derivada tercera es cons- 
tante, f"'(x) = C, y la fórmula anterior se transforma en 

f(x) - P(x) = j(x - a)(x - m)(x - b) = -(t + h)t(t - h), 

6 6 

donde t = x — myh = (b — a)/2. Por tanto 

R = £ U(x) - P(x)] dx = ^[ (t 3 - h 2 t) dt = 0, 
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ya que la última integral es una función impar. Esta propiedad queda interpretada 
en la figura 15.5. La curva punteada es la gráfica de un polinomio cúbico / que 
coincide en P en a, m, b. En este caso R = [/(*) — P(x)]dx = A L — A 2 , don- 

de Aí y A 2 son las áreas de las dos regiones sombreadas. Como que R = 0 las dos 
regiones tienen áreas iguales. 

Acabamos de ver que la ecuación (15.40) es válida si P es un polinomio de 
grado — 3 que coincide con / en a, m y b. Eligiendo cuidadosamente este poli- 
nomio podemos mejorar considerablemente la esdmación del error (15.41). Ya he- 
mos impuesto tres condiciones a P, a saber, P(á) = /(a), P(m) = /(m), P(b) = f(b). 
Imponemos ahora una cuarta condición, P'(m) — f(m). Esto hace que P y / ten- 
gan la misma pendiente en (m,/(m)), y podemos esperar que esto mejorará la 
aproximación de / por P en el intervalo [a, &]. 



Figura 15.5 Las dos regiones sombreadas tienen la misma área para cualquier polinomio 
cúbico de interpolación. 


Para demostrar que un tal P puede elegirse siempre, sea Q el polinomio cua- 
drático que coincide con / en a, m, b, y sea 

P(x) = Q(x) + A(x - a)(x - m)(x - b), 

donde A es una constante que hay que determinar. Cualquiera que sea A, este po- 
linomio cúbico P coincide con Q y por tanto con / en a, m, b. Elijamos ahora A 
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de modo que F(m) = f(m). Derivando la fórmula anterior y poniendo x = m 
obtenemos 


P'(m) = Q'(m) + A(m - a)(m - b). 

P°r consiguiente, si tomamos A = [f(m) - Q , (m)]/[(m - a)(m - b )] se satis- 
face también la condición P'(m) = f(m). 

A continuación demostramos que para este P elegido tenemos 

„ f (iì (zì 

(15.42) f(x) — P(x) = (x — a)(x — m)(x — b )-—— 

4! 

para algún z en (a, b), con tal de que exista la cuarta derivada / (4) en [a,b\. Para 
demostrar (15.42) razonamos como en la demostración del teorema 15.3. Obser- 
vamos primero que (15.42) se satisface para cualquier z si x = a, m o b. Por con- 
siguiente, supuesto que x # a, x ¥- m, x # b, mantengamos x fijo, e introducimos 
una nueva función F definida en [a, b\ por la ecuación 

F(t) = A(x)[f(t) - P(t )] - A(t)[f(x) - P(x)], 

donde 

A(t) = (t- a )(t - mf(t - b). 

Observemos que F(t) = 0 para t = a, m, b, y x. Según el teorema de Rolle, F’(t) 
se anula en cada uno de los tres intervalos abiertos determinados por esos cuatro 
puntos. Además, F'(m) = 0 debido a que A'(m) = 0 y f(m) = F(m). Por consi- 
guiente F'(t) = 0 por lo menos en cuatro puntos distintos de (a,b). Por el teorema 
de Rolle F"(t) = 0 por lo menos en tres puntos, F'"(t) = 0 por lo menos en dos 
puntos, y F (i) (t) = 0 por lo menos en un punto, sea éste t = z. De la definición 
de F resulta 

F«\t) = A(x)[f«\t) - P<«(/)] - A [i) (t)[f(x) - P( X )] 

= A(x)f ( «(t)-4\[f(x)-P(x)]. 

Cuando sustituimos í = zen esta ecuación obtenemos (15.42). 

Es cosa sencilla ahora demostrar la regla de Simpson en la forma siguiente. 

teorema 15.14. regla de simpson. Si f tiene derivada cuarta continua 
en [a, b] y si m = (a + b)/2, entonces 

(15 ' 43) í f(x) dx = lf(a) + 4/(m) + /(*)] - ~ ^ 8 q )S / <4, (c) 

para un cierto c de [a, b\. 
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Demostración. Representemos con M 4 y m 4 , respectivamente, los valores má- 
ximo y mínimo de / (4) en [ a, b], y sea B(x) = — (x — á)(x — mf(x — b)/ 4!. 
Ya que B(x) ^ 0 para cada x en [a, 6], la ecuación (15.42) nos lleva a las des- 
igualdades 


m 4 B(x) < P(x) -f(x) < M, B(x). 
Integrando, encontramos 

(15.44) m 4 £ B(x) dx < f [P(x) - f(x)] dx < Aí 4 ff B(x) dx. 
Para calcular la integral J* B(x)dx tomamos h = (b — a)/2 y tenemos 


r 


B(x) dx = - ^ J (x - a)(x - mf(x - b) dx = - 2 J ^ 

= _2f íV _ AVí = ^ = ( -^. 

4!Jo 4! 15 2880 

Por tanto, las desigualdades de (15.44) nos dan 


(t + h)t\t - h) dt 


m 4 < 


[P(x)-f(x)]dx<M<. 


>880 r" 

(b - af 1 

en [«,&], 
dmo M 4 e 

f W (c) = C[P(X) -f(x)] dx 

(b — af Ja 


Pero ya que / (4) es continua en [a, b], alcanza un valor cualquiera comprendido 
entre su mínimo m 4 y su máximo M 4 en algún punto de [a, 6]. Luego 


para algún c en [a, b]. Puesto que P(x)dx = %(b — a)[/(a) + 4 f(m) + /(&)], 
esta ecuación nos da (15.43). 

La regla de Simpson es de especial interés porque su precisión es mayor de 
lo que podría esperarse a partir del conocimiento de la función / tan sólo en tres 
puntos. Si los valores de / se conocen en un número impar de puntos igualmente 
separados, a, a + h, ..., a + 2 nh, ordinariamente es más sencillo aplicar la regla 
de Simpson sucesivamente a cada uno de los intervalos [a, a + 2 h], [a + 2 h, 
a + 4/í], .... que actuar con un polinomio de grado ^ 2« sobre el intervalo 
completo [a, a + 2 nh]. Aplicando la regla de Simpson de esta forma, obtenemos 
la siguiente extensión del teorema 15.14. 

TEOREMA 15.15. REGLA DE SIMPSON GENERALIZADA. SupOHgamOS que f 
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tenga derivada cuarta continua en [a, b]. Sean h = (b-a)/(2n) y f k = f(a+kh) 
para k = 1,2, ... ,2 n — 1. Tenemos entonces 

í /w ix ~ ( fM + +2 t^+m) - 

para un cierto c en [a, b]. 

En el ejercicio 9 de la próxima sección se propone la demostración de este 
teorema. 

15.21 Ejercicios 

1. a) Aplicar la regla de los trapecios con n - 10 para calcular un valor aproximado de 
la integral 

-=/:!• 

Obtener cotas superior e inferior del error. [Véase ejercicio 10 b) para comparar la 
precisión con la que se obtiene con la regla de Simpson.] 

b) cCuál es el menor valor de n que puede garantizar seis cifras exactas en el cálculo 
de log 2 por este método? 

2. a) Demostrar que existe un número positivo c en el intervalo [0,1 ] tal que la fórmula 

SljMdx =f(c) +f(-c) 
es exacta para todos los polinomios de grado <3. 

b) Generalizar el resultado de la parte a) para un intervalo cualquiera. Esto es, demos- 
trar que existen dos constantes ci y c 2 en [a, 6] tal que la fórmula 

{ /M & = t/(^) +/(c 2 )] 


es exacta para todos los polinomios de grado <3. Expresar ci y c 2 en función de a y b. 

3. a) Demostrar que existe una constante positiva c tal que la fórmula 

Í l/2 

_!//(*) dx = Uf(-c) +f( 0) +/(c)] 
es exacta para todos los polinomios de grado <3. 

b) Generalizar el resultado de la parte a) a un intervalo cualquiera. Esto es, demostrar 
que existen dos constantes Cj y c 2 en [a, b) tales que la fórmula 

í fix)dx = ^~r[ fiCi) +/ (c *)] 
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es exacta para todos los polinomios de grado <3. Expresar c\ y en función de a y b'. 

4. Demostrar que existen dos constantes positivas a y b tales que la fórmula 

J" e-*f{x) dx = \[af(b) + bf(a)] 

es exacta para todos los polinomios de grado <3. 

5. Demostrar que existe una constante positiva c tal que la fórmula 

J ” e~*'f(x) dx=^Z [f(-c) + 4/(0) +f(c)] 

es exacta para lodos los polinomios de grado <5. 

6. Sea P« el polinomio de interpolación de grado <n que coincide con / en n + 1 puntos 
distintos xo,xi,...,x«. 

a) Demostrar que existen las constantes Ao(n), A\(n),... ,A„(n), que dependen tan 
sólo de los números xo, xi,..., x„, a, y b, y no de f, tales que 

j*P n (x)dx =ÏA k (n)f(x k ). 

Los números A k (n) se llaman pesos. (Algunas veces números de Christoffel.) 

b) Para un conjunto dado de puntos de interpolación distintos y un intervalo dado 

[a, b], sean W 0 (n),Wi(n) _ ,W„(n), n + 1 constantes tales que la fórmula 

\ b J(x)dx =±W k (ri)f(xù 

es exacta para todos los polinomios de grado <n. Demostrar que 



Éste es un sistema de n + 1 ecuaciones lineales que puede usarse para determinar los 
pesos. Puede demostrarse que este sistema tiene siempre solución única. También puede 
demostrarse que para una elección adecuada de puntos de interpolación es posible hacer 
todos los pesos iguales. Cuando los pesos son todos iguales la fórmula de integración 
se llama fórmula de integración de Chebyshev. Los ejercicios 2 y 3 son ejemplos de esa 
fórmula. E1 ejercicio siguiente demuestra que para una elección adecuada de puntos de 
interpolación la fórmula de integración que resulta es exacta para todos los polinomios 
de grado <2w + 1. 

7. En este ejercicio se pueden usar las propiedades de los polinomios de Legendre esta- 
blecidas en las secciones 6.19 y 6.20. Sean xo, Xi,...,x H los ceros del polinomio de Le- 
gendre P„+i(x). Esos ceros son distintos y están en el intervalo [ — 1,1]. Sea f(x) un polino- 
mio en x cualquiera de grado <2/t + 1. Dividamos f(x) por P„ t i(x) y escribamos 

f(x) = P n+l (x)Q(x) + R(x), 
siendo los polinomios Q y R de grado <n. 
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a) Demostrar que el polinomio R coincide con / en los ceros de P„+i y que 
J^/C*) dx = J 1 ^ R(x) dx. 


b) Demostrar que existen n + 1 pesos Wo (n),.... W„(«) (independientes de /) tales que 

j 1 f(x)dx = Ỳ W k (n)f(x k ). 

Esto da una fórmula de integración con n + 1 puntos de interpolación que es exacta para 
todos los polinomios de grado <2 n + 1. 

c) Hacer n = 2 y demostrar que la fórmula de la parte b) se convierte en 

JJ/w dx = i/(-V!) + 1 /(o) + f /(V!) • 

Esta fórmula es exacta para todos los polinomios de grado <5. 

d) Introducir una transformación Jineal conveniente y escribir nuevamente la fórmula 
de la parte c) para un intervalo cualquiera [a, b]. 

8. En este ejercicio se expone un método debido a Peano para deducir la fórmula que da 
el error en la regla de Simpson. 

a) Con la integración por partes reiterada deducir la relación 

J u(t)v'"(t)dt = u(t)v"(t) - u'(t)v(t) + u(t)v(t) - J g(t)dt, 
donde g(t) = u"'(t)v(t). 

b) Suponer que <p posee derivada cuarta continua en el intervalo [ — 1,1]. Tomar 

v(t) = /(1 - tf/6, u(t) = <p(t) + <p(-t), 
y usando la parte a) demostrar que 

J!, <P(t)dt = J[ç>(-1) + 4?>(0) + y(l)] - \\g(t)dt. 

Demostrar luego que jj g(í) dt = v (*)(c)/90 para un cierto c en [-1,1]. 

c) Con una transformacìón lineal conveniente deducir el teorema 15.14 a partir del 
resultado de la parte b). 

9. a) Sean a lt a-2 . a„ n números no negativos cuya suma es 1. Supongamos que <p 

es continua en un intervalo [a, b). Si Ci, cz, ...,c n son n puntos cualesquiera en [a, b) 
(no necesariamente distintos), demostrar que existe por lo menos un punto c en [ a, b ] 
tal que 


2 a k<P(c k ) = <p(c). 

k=1 

[Indicación: Designar con M y m el máximo y el mínimo respectivamente de <p 
en [a, b] y emplear la desigualdad m < <p(c t ) < M.J 
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b) Usar la parte a) y el teorema 15.14 para deducir la regla de Simpson generalizada 
que se dio en el teorema 15.15. 

10. Calcular log 2 a partir de la fórmula log 2 =Jj x~ l dx utilizando la regla de Simpson 
generalizada con a) n = 2; b) n = 5. Dar en cada caso cotas superior e inferior del error. 

11. a) Sea <p(t) un polinomio en t de grado <3. Expresar <p(t) mediante la fórmula de 
interpolación de Newton e integrar para deducir la fórmula 


J* <p(t)dt = f [y(0) + 3ç>(l) + 3y(2) + 9>(3)]. 

b) Sea P el polinomio de interpolación de grado <3 que coincide con / en los puntos 
a,a + h, a + 2h, a + 3 h, siendo h > 0. Con la parte a) demostrar que 

r a+3h 3A 

I P(x) dx = — [/(a) + 3f(a + h) + 3 f(a + 2 h) +f(a + 3A)]. 

c) Suponer que / posee derivada continua en [a, 6], y sea h = (b — «)/3. Demostrar 
que 

£ /M dx = b —^ (f(a) + 3 f(a + h) + 3 f(a + 2 h) +f(b )] - q & f w k) 


para algún c de [a,b~\. Esta íórmula de integración aproximada se llama regla de Cotes. 

d) Con la regla de Cotes calcular log 2 = JJ x _1 dx y dar cotas superior e inferior 
del error. 

12. a) Utilizar la ecuación vectorial r (t) = asenti+ b cos t j siendo 0 < b < a, y demos- 
trar que la longitud L de una elipse viene dada por la integral 

L = 4a J^ 1 yjl — lc 2 sen 2 t dt, 


donde k = y/a 2 — b 2 /a. 

b) Probar que la regla de Simpson da la fórmula 

L = 3 + b + V8(« 2 + b 2 )\ - ^ /<«(c) 

para un cierto c en [0, ir/2\, siendo f(t) = y/Y — k 2 sen 2 /. 


15.22 Fórmula de sumación de Euler 

Sea n un entero positivo. Cuando la fórmula de los trapecios (teorema 15.13) 
se aplica al intervalo [0,«] toma la forma 
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para un cierto c en [0, »]. Si / es un polinomio cuadrático entonces f' es cons- 
tante y por tanto j"(c) — /"(0). En este caso la fórmula puede volverse a escribir 
en la forma 

(15.45) J= | o ”/W dx + /(°)+/( w ) + . 


Esta fórmula es exacta cuando / es un polinomio cualquiera de grado ^ 2. 

Euler descubrió una notable generalización de esa fórmula que es válida 
para cualquier función con derivada primera continua. Puede utilizarse para apro- 
ximar integrales mediante sumas o, lo que es más frecuente, para calcular o apro- 
ximar sumas por medio de integrales. Por este motivo corrientemente se la llama 
fórmula de «sumación» y no de integración. Puede establecerse del siguiente 
modo. 

teorema 15.16. fórmula de sumación de euler. Si f tiene derivada 
continua en [0, «], entonces 

(15.46) J /( fe ) = / o ”/« dx + /(0) + /(n) + (x - [*] - *)/'(*) dx, 

en donde [x] es el mayor entero ^ x. 

Demostración. La integración por partes nos da 

(15.47) J“ (* - *)/'(*) dx = (n — *)/(») + */(0) - j* f(x) dx. 

Consideremos ahora la integral Jô í x ìf'Mdx y la escribimos como una suma de 
integrales en cada una de las cuales [x] tiene un valor fijo. Así pues, tenemos 


/ 0 ” [*]/'(*) dx =ï Jf 1 [»]/'(*) dx =”f r j r r +1 f’(x) dx 

= Ir(f(r + 1) ~f(r)) =|r/(r + 1) -frf(r) 
= -”f fír + 1) + fV + 1 )f(r + 1) -f rf(r) 

= - îm +»/(») = -ìf(k) +/(o) +»/(»). 
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Restando ésta de la ecuación (15.47) obtenemos 

J o "(* - M - i)f(x) dx=2 m - m + f(n) - J dx , 

que es equivalente a (15.46). 

La última integral del segundo miembro de (15.46) puede ponerse en la forma 
/ 0 (x - [x] - ì)f'(x) dx = / o ” cpfx^ffx) dx, 

en donde es la función defmida por 

(x — M — \ si x no es entero 
<Pi(x) = í 

(0 si x es entero 

La gráfica de % es la de la fìgura 15.6 a). Observemos que ( f,(x + 1) = <Pi(x), lo 
cual significa que r fí es periódica con período 1. Asimismo, si 0 < x < 1 tenemos 
<Pi(x) = x — y 2 , así que JJ 9>i(t)dt = 0. 

La figura 15.6 b) es la gráfica de %, integral indefinida de r P u dada por 

fzM = /’ <PiO)dt. 

Es fácil comprobar que <p 2 también es periódica con período 1. Además, tenemos 

= ,i o SlS i. 


<PM <pfx) = jjp,(t)dt 
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Esto prueba que — % ^ <p 2 (x) ^ 0 para todo x. Las desigualdades — % < VÁx) < 0 
son válidas salvo cuando x es un entero o la mitad de un entero. 

E1 teorema siguiente da otra versión de la fórmula de sumación de Euler en 
función de <p 2 . 

teorema 15.17. Si f" es continua en [0,n] tenemos 

(15.48) J/(fc) = J 0 dx + ^ (0) - J o %(*)/'(*) dx ■ 

Demostración. Puesto queç' 2 (x) = <p x (x) en los puntos de continuidad de 
<Pi, tenemos 

/; <Pi(x)f'(x) dx = /; <p' 2 (x)f(x) dx. 

La integración por partes nos da 

/; <pí(x)f(x) dx = <p 2 (x)f(x) |;- /; <p 2 (x)f(x) dx = -/; ^, 

puesto que <p 2 (n) =<p 2 ( 0) = 0. Aplicando esta fórmula en (15.46) obtenemos 

(15.48) . 

Observación. Si bien los teoremas 15.16 y 15.17 se refieren al intervalo [0,n], 
ambas fórmulas son válidas cuando 0 se sustituye por 1 o por cualquier entero po- 
sitivo <n. 

Como ejemplo de aplicación de la fórmula de sumación de Euler deducire- 
mos la siguiente fórmula para log n\. 

teorema 15.18. Para cualquier entero positivo n tenemos 

( 15 . 49 ) log «! = (n + \) log n — n + C + E(n), 

donde 0 < E(rí) < 1/(8«) y C = 1 +ír f~*<pÁf)dt. 

Demostración. Pongamos f(x) = log x y apliquemos el teorema 15.17 al 
intervalo [l,n]. Ello nos da 
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Utilizando la relación / log t dt = t log t — t podemos poner esa ecuación en 
la forma 

15.50 logn! = (n + i)logn — n + 1 + j ^~dt. 

Puesto que l%(/)| ^ % la integral impropia J j” t~\ 2 (t)dt converge absolutamente 
y podemos escribir 

- J" ^d, - J’tóï*. 

Por consiguiente, la ecuación (15.50) se transforma en 

log n! = (n + £) log n — n + C — J dt , 

donde C = 1 + J” t~\ 2 (t)dt. Puesto que — % < <p 2 (t) < 0 salvo si t es un entero 
o la mitad de un entero, obtenemos 

o <-rm dl< ±, 

t 2 8 n 

Esto demuestra (15.49), poniendo E(n) = — t~*<p 2 (t)dt. 

Del teorema 15.18 podemos deducir la fórmula de Stirling que permite una 
estimación de n\. 

teorema 15.19. fórmula de stirling. Si « es un entero positivo tenemos 
yj2ïr n n+1/2 e~ n < n! < n n+m e~ n (\ + . 

Demostración. Utilizando la ecuación (15.49) y las desigualdades para E(n) 
obtenemos 

exp ((n + ì) log n - n + C) < n! < exp ((n + i) log n - n + C + , 

en donde exp (t) = e*. Teniendo en cuenta que e° < 1 + 2x, con x = 1/(8 n), po- 
demos poner esas desigualdades en Ia forma 

An n+1/2 e~ n < n! < An n+1/2 e~ n (í + , 


(15.51) 
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donde A = e°. Para terminar la demostración es preciso probar que A = \l2n. 
Deduciremos esto a partir de la desigualdad 


(15.52) 


nn < 


/2 2 ”(n !)V n(2 n + 1) 

l (2n)! ; 




descubierta por John Wallis (1616-1703). Primero demostraremos que la desigual- 
dad de Wallis implica A = V2Ïr, luego exponemos la demostración de (15.52). 
Si ponemos 


la desigualdad (15.51) implica 


que equivale a 


Á<Á ' <A { i+ i)- 

ìdo n -> oo. En (15.52) e 
. / 2 Zn n 2n+1 e~ 2n AÌ \ 2 ^ n(2n + 1) 

5 \(2n) 2n+1/2 e~ 2n A 2 J S 2 ’ 


Esto prueba que A„-> A cuando n -> °°. En (15.52) escribimos n! = n n+ ' A e~ n A„ 
para conseguir 


2 n + 1 
2 n 


Haciendo que n->« en esta última desigualdad obtenemos 


Lo que demuestra que A 2 = 2n. Puesto que A > 0 tenemos A = \l2n, como se 
afìrmó. 

Queda por demostrar la desigualdad de Wallis (15.52). A tal fin introduci- 
mos los números 


fir/2 

/„ = J o sen” t dt, 

siendo n un entero no negativo cualquiera. Observemos que / 0 = tt/2 e L = 1. 
Para 0 ^ t ^ tt/ 2 tenemos 0 — sen t ^ 1; luego 0 — sen n+1 t — sen” t. Esto de- 
muestra que la sucesión {/„} es monótona decreciente. Por tanto podemos escribir 
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Calcularemos ahora cada uno de los miembros de esta desigualdad; esto nos con- 
ducirá inmediatamente a la desigualdad de Wallis. 

La integración de la identidad 

+ (cos t sen" +1 t) — {n + 1) sen” t — (n + 2) sen’ I+2 t 
dt 

en el intervalo [0,7r/2] nos da 

0 = (n + l)/„ - (n + 2 )/„ +2 , 
o 

(15.54) /n+2^ 5 - 1 ^/,. 

n + 2 

Utilizando esta fórmula recurrente reemplazando n por 2k — 2 encontramos 

I ìk _ 2fc - 1 _ 2k(2k - 1) 

/**-* 2 k (2 k) 2 

Multiplicando esas ecuaciones para k = 1, 2, ..., n se halla 


TT / 2 * _ -rr 2k(2k - 1) _ (2n)! 
«/»-. (2/c) 2 2 2 "(n !) 2 


Simplificado el producto del primer miembro resulta / 2 „// 0 . Puesto que / 0 = 7r/2 
obtenemos 


(15.55) 


(2n)! 7T 
2 2 "(n !) 2 2' 


Análogamente aplicamos la fórmula de recurrencia (15.54) reemplazando n por 
2A; — 1 y multiplicando las ecuaciones que resultan para k = 1 , 2, ..., n con lo 
que se obtiene 


TT Wì (2/c) 2 _ 2 2 "(n!) 2 _ 1 tt J_ 

*=i hk-i *=i 2k(2k + 1) (2n + l)! 2n + 1 2 / 2 „ ' 

E1 producto del primer miembro una vez simplificado se reduce a / 2 „+i//i = 
= / 2 „+i, con lo que llegamos a 


/2„/ 2 „+l 


2(2n + 1)' 


(15.56) 
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Puesto que I m+Í = 2 n I m -J{2n + 1), la ecuación (15.56) implica 



Utilizamos este resultado en (15.53), así como las relaciones (15.55) y (15.56). 
Multiplicando luego por tt 2 /4 obtenemos la desigualdad de Wallis (15.52). 

15.23 Ejercicios 

1. Si f es un polinomio de grado < 2, demostrar que la fórmula de sumación de Euler 
(15.48) se reduce a la fórmula de los trapecios, expresada en la ecuación (15.45). 

2. La constante de Euler se define mediante la fórmula 

c ■„“?.( -'oe")- 

(Véase la sección 10.17 del volumen I.) Demostrar con la fórmula de sumación de Euler 
que 



1 E(n) 

+ C +--V 

2 n rr 


donde 0 < E(n) <+ Asimismo, demostrar que 


— 


3) a) Si s > 0, s 5* 1, demostrar con la fórmula de sumación de Euler que 


siendo 


Îp=r^ + C(í)+S l h^ dt ’ 

*=i 

C(,) = l 


b) Si s > 1, demostrar que C(s) = í(s), siendo f la función zeta 
para s > 1 mediante la serie 


de Riemann definida 


w-2f- 
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Esta serie diverge para s < 1. No obstante, puesto que la fórmula que da C(s) en la 
parte a) tiene sentido para 0 < s < 1, puede utilizarse para extender la defìnición de ((s) 
al intervalo abierto 0 < s < 1. Así pues, para s>0ys?il tenemos la fórmula 

1 f°° t - [/] 

ç(í ) = i + -_ T _ J J i -^dt. 

Esto es un teorema si s > 1, y una definición si 0 < s < 1. 

En los ejercicios del 4 al 6, 92 es la función introducida en 15.22. 

4. a) Emplear la fórmula de sumación de Euler para demostrar que 

2 log 2 *-("+*) log 2 n - 2n log n + 2n - 2 + 2J" ?,,(*) l0g 1 dx. 

b) Utilizar la parte a) para deducir que para n > e tenemos 

2 log 2 k = (n + £) log 2 n — 2n log n + 2n + A — E(n ), 


siendo A una constante y 0 < E(n) < E(n) < - 


5. a) Con la forma de sumación de Euler demostrar que 

V'og* 1, , ,llog« |* B 2 log x — 3 

2—-jlos’”+j—-J, 

b) Utilizar la parte a) para deducir que para que n > e 3/í tenemos 




siendo A una constante y 0 < E(rì) < 9 . 

o n 

6. a) Si n > 2 utilizar la fórmula de sumación de Euler para demostrar que 


ŷ _i_ 

k log k 


log k 
= log (log n) +- 


ïnb. + 4i5p- |0 s <,0 s 2 >-r 


<Pi(x) 


2+3 log x + 2 log 2 ; 
(x log xf 
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b) Utilizar la parte a) para deducir que para n > 2 tenemos 

tinLï ■ 108 (lo6 “ > +A + ^L-n - 


siendo A una constante y 0 < E(n) < 


4w 2 log n ’ 


7. a) Si a > 0 y p > 0, demostrar con la fórmula de sumación de Euler que 
2'"“’- 

HL 


siendo r la función gamma. 
b) Mediante la parte a) demostrar que 




- + 0, donde 0 < 6 < 1. 


8. Deducir los límites siguientes con la ayuda de la fórmula de Stirling o de la de Wallis 
o de ambas. 


(«!) 2 2 2 " r 
b) ltm - — = nJlT. 


n)\J n - 

c) lim ( —1)"^ f'jn = 

M2 

9. Sea L = I sen" t dt, siendo n un entero no negativo. En la sección 15.22 se 
que la sucesión {/„} satisface la fórmula de recurrencia 

/ - n+1 T 

In+i ~n+ 2 7 "’ 

Pongamos f(n) = | >sìendo r la función gamma. 

a) Utilizar la ecuación funcional T(s + 1) = sr(s) para demostrar que 
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b) Con la parte a) deducir que 
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1.5 Ejercicios (pág. 8) 


Capítulo 1 


1. Si 8. 

2. Si 9. 

3. Si 10. 

4. Si 11. 

5. No 12. 

6. Si 13. 

7. Si 14. 


31. a) No b) No 

1.10 Ejercicios (pág. 16) 


Si 15. Si 

Si 16. Si 

Si 17. Si 

No 18. Si 

Si 19. Si 

Si 20. Si 

No 21. Si 

c) No d) No 


22. Si 

23. No 

24. Si 

25. No 

26. Si 

27. Si 

28. Si 


2 . 

3. 

4. 

17. 

18. 

19. 

20 . 
21 . 
23. 


5. Si ; 

6. No 


1 


10. Si 

11. Si 

Si ; 2 8. No 12. Si 

Si ; dim = 1 + \n si n es par, l(n + 1) si « es impar 
Si ; dim = \n si n es par, \(n + 1) si n es impar 
Si ; k + 1 
No 

a) dim =3 b) dim =3 c) dim =2 d) dim = 2 
a) si a # 0 y b ^ 0, el conjunto es independiente, dim = 3;si a ó b es cero, el con- 
junto es dependiente; dim = 2 (b) independiente , dim =2 c) si o + 0, indepen- 
diente , dim =3; si a = 0,dependiente, dim =2 d) independiente ; dim = 3 
e) dependiente; dim =2 f) independiente dim =2 g) independiente dim =2 
h) dependiente; dim =2 i) independiente; dim =2 j) independiente; dim =2 


1.13 Ejercicios (pág. 24) 


1. 

a) 

No 

b) No 

c) No 

d) No e) Si " 


8. 

a) 

ìV? 

b) 

g(x) = b[x 

e'- + 1 \ , 

-, b arbitrario 

4 / 




(n + l)(2w + 1) 

n + 1 

/ 2n + ì\ 


10. 

b) 

— 

6 n 

H--— b 

O gU) -(/-—) 

, a arbitrario 

11. 

c) 

43 

d) ,?(/) = 

o(l — f t), a 

arbitrario 


12. 

a) 

No 

b) No 

c) No 

d) No 


13. 

c) 

1 

d) e 2 - 1 




14. 

c) 

/t!/2' ri 

1 





1.17 Ejercicios (pág. 36) 

1. a) y b) i\/3(l,l, 1), „V6(1, -2, 1) 
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2. a) |V2(1, 1,0,0), s\/6(-l, 1,2,0), à\ / 3 (1, -1, 1, 3) 
b) -3V3 (1, 1,0, 1), ~ 2 ’ 6 > 1 ) 

6. | - \ log 2 3 

7. e 2 - 1 

8. \(e - e- 1 )+- g x; 1 - 7e“ 2 

9. n-lsenx 

10. î - V 

Capítulo 2 

2.4 Ejercicios (pág. 44) 

1. Lineal ; dimensión del núcleo 0, rango 2 

2. Lineal; dimensión del núcleo 0, rango 2 

3. Lineal; dimensión del núcleo 1, rango 1 

4. Lineal ; dimensión del núcleo 1, rango 1 

5. No lineal 

6. No lineal 

7. No lineal 

8. No lineal 

9. Lineal; dimensión del núcleo 0, rango 2 

10. Lineal; dimensión del nócleo 0, rango 2 

11. Lineal; dimensión del núcleo 0, rango 2 

12. Lineal; dimensión del núcleo 0, rango 2 

13. No lineal 

14. Lineal; dimensión del núcleo 0, rango 2 

15. No lineal 

16. Lineal; dimensión del núcleo 0, rango 3 

17. Lineal; dimensión del núcleo 1, rango 2 

18. Lineal; dimensión del núcleo 0, rango 3 

19. No lineal 

20. No lineal 

21. No lineal 

22. No lineal 

23. Lineal; dimensión del núcleo 1, rango 2 

24. Lineal; dimensión del núcleo 0, rango n + 1 

25. Lineal; dimensión del núcleo 1, rango infinito 

26. Lineal ; dimensión del núcleo infinita , rango 2 

27. Lineal; dimensión del núcleo 2, rango infinito 

28. N(T) es el conjunto de las sucesiones constantes; T(V) es el conjunto de las sucesio- 
nes con límite 0 

29. d) {Lcosx.senx} es una base para T(V); dimT(V) = 3 e) N(T) = S f) Si 
T(f)=cf siendo c^0, entonces ceT(V) con lo que tenemos /(xj^Cj + c,, cos x + c 3 sen x; 
si Cj =0, entonces c = ir y f(x) = cos x + c 2 sen x, donde c x , c 2 son arbitrarias y 
no simultáneamente nulas; si c^ # 0, entonces c = 2iry f(x) = c v donde ci no es nula 
pero arbitraria. 
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2.8 Ejercicios (pág. 53) 


3. Si ; x = v, y = u 

4. Si ; x =u, y = -v 

5. No 

6. No 

7. No 

8. Si ; * 5= log u, y = log v 

9. No 

10. Si x = u - 1, y = v - 1 

11. Si ; x — \(v + u), y = l(v - u) 

12. Si ; x = l(v + u), y = j(2v - u) 

13. Si ; x = w, y = v, z = u 

14. No 

15. Si ; x = u, y = \v, z =\w 

16. Si ; x =u, y = v, z = w - u - v 

17. Si ; x=u- 1, y = v — l, z=w + 1 

18. Si ; x = u - 1, y = v — 2, z =w - 3 

19. Si ; x =u, y = v — u, z = w - v 

20. Si ; x = \(u - v + w), y = \(v - w + u); z = \(w - u + v) 

25. (S + Tf = S 2 +ST + TS + T 2 \ 

(S + Tf = S 3 + TS 2 + STS + S 2 T + ST 2 + TST + T 2 S + T 3 

26. a) (ST)(x,y,z) = (x +y +z,x +y,x); (TS)(x,y, z) = (z, z + y, z + y + x); 

(ST - TS)(x, y, z) = (x + y, x — z, -y - z); S 2 (x, y, z) = (x, y, z); 

T 2 (x,y, z) = (x, 2x + y,3x +2y + z); 

(STf(x, y, z) = (3x + 2y + z, 2x + 2y + z, x + y + z); 

(TSf(x, y, z) = (x + y + z, x + 2y + 2z, x + 2y + 3z); 

(ST — TSf = (2x + y — z, x + 2y + z, -x +y +2z); 

b) S~\u, v, w) = (iv, v, u); T~'(u, v, w) = (u,v — u,w — v); 

(ST)-\u, v, w) =(w,v -w,u -v); (TS)~\u, v, w) = (w - v, v - u,u) 

c) (T - I)(x,y,z) =(0,x,x +y); (T - lf(x,y, z) = (0,0, x); 

(T - l) n (x, y, z) = (0, 0,0) si n > 3 

28. a) Dp(x) = 3 - 2x + \2x 2 ; Tp(x) = 3x - 2x 2 + \2x 3 ;(DT)p(x) = 3 - 4x + 36x 2 ; 
(TD)p(x) = -2x + 24x 2 ; (DT - TD)p(x) = 3 - 2x + \2x 2 ; 

(T 2 D 2 — D 2 T 2 )p(x) = 8 — \92x b) p(x) = ax, a un escalar cualquiera 

c) p(x) = ax 2 + b, a y b escalares cualesquiera d) Todo p de V 

31. a) Rp(x) = 2; Sp(x) = 3 - x + x 2 ; Tp(x) = 2x + 3x 2 - x 3 + x 4 ; 

(ST)p(x) = 2 + 3x - x 2 + x 3 ; (TS)p(x) = 3x - x 2 + x 3 ; (TSfp(x) = 3x - x 2 + x 3 ; 

(T 2 S 2 )p(x) = -x 2 + x 3 ; (SPT 2 )p(x) = 2 + 3x - x 2 + x 3 ; (TRS)p(x) = 3x; 

(RST)p(x) = 2 

b) N(R) = {p | p( 0) =0}; R(V) = {p \p es constante}; N(S) ={p\pes constante }; 
S(V) = V; N(T) = {O} ; T( V) = {p \ p(0) = 0} c) T 1 = S 

d) (TSf = I — R; S n T” = 1 

32. T no es uno a uno en V porque aplica toda sucesión constante en la misma sucesión. 
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2.12 Ejercicios (pág. 62) 


1. a) La matriz identidad I = (S, k ), siendo S it = 1 si j = k, y S jk = 0 si j ^ k 

b) La matriz cero O —(a, k ), en la que cada elemento a] k = 0. 

c) La matriz (cô jk ), siendo (ô jk ) la matriz identidad de la parte a) 


L0 1 0. 
a) -5/ + Ij, 9/ - 12 j 


1 , 

0 1 01 


0 10 0 

0' 

b, [ 

0 0 lj 

c) 

0 0 10 

0 




0 0 0 1 

0 


«c _a- g a * n- g a 
-1: 3 . c a 

5. a) 3i + 4 j + 4k; dimensión del núcleo 0, rango 3 b 


7. a) 7X4/ —j + k) = (0, —2); dimensión del núcleo 1, rango 2 b) 


c) 


1 3 

0 -2 


‘0 1 f 

0 1 -1 


d) 


=y\ « 2 =*. e 3 =/, tvj = (i, i), 

fi -il 


8. a) (5,0, —1); dimensión del núcleo 0, rango 2 
c) e x = i, e 2 = i +j, w x = (1, 0, 1), 


b) 


= (0,0,2), h-3 =(0,1,0) 
^ 11 

9. a) ( — 1, —3, —1); dimensión del núcleo 0, rango 2 b) 


c) e t = /, e 2 =j - i, w x = (1, 0, 1), w 2 = (0, 1, 0), 
10. a) e x — e 2 ; dimènsión del núcleo 0, rango 2 b) 


.1 u 
(0, 0,1) 


0-1 -10 

11 . 

10 0-1 


'l 2 
5 4 
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6 0 0 0 
0 2 0 0 
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2.16 Ejercicios (pág. 70) 

P 

1. B + C = 0 


15 -14“ 

-15 14 


AC 


[: î- 


CA = 


2-8 4 
4-16 8 

y 6 arbitrarios b) 


l~2b b 

3. a) a = 9, b =6, c = 1, d = 5 b) 


-1 4 -2" 

-4 16 -8 

7 -28 14 

_ [“ 30 -28' 

-30 28 


:i y b arbitrarios 
6=6, o=0, d = -2 


6 14 8 

-7 5 -5. 


cos nO — sen nO 
sen nO cos nO 
n(n + 1) 


5 -4 
3 24 


L 

1 0“ 
-100 1 


, siendo 6 y c arbitrarios y a es una solución 
~cualquiera de la ecuación ir = —bc 


, siendo a arbitrario 


cualquiera de la ecuación a 2 = 1 — bc 

T]- c -|T ï] 


siendo 6 y c arbitrarios y a e 
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14. b) ( A + BÝ = A- + AB + BA + B-\ (A + B)(A — B) = A'- + BA — AB — B- 
c) Para aquellos que conmutan 


2.20 Ejercicios (pág. 83) 

1. (.V, »\ 2 ) =(«, -l, ^) 

2. Ninguna solución 

3. (jf.v.r) = (l, -1,0) + ,(-3,4,1) 

4. (x, v,r) = (1, -1,0) + f(-3,4, 1) 

5. (.v, »>,-,„) = (1, 1,0,0) + ,(l, 14,5,0) 

6. (x, v, :,n) = (1, 8, 0, -4) + 1(2, 7, 3, 0) 

7. (.v, v, -, „,(•)=,,(-1, 1,0, 0, 0) + l.,( -1,0, 3, -3, 1) 

8. (.v, i\+ „) = (I, I, I, -1) + /,(-1,3, 7,0) + /.,(4, 9, 0,7) 

9. (,v, v, z) = (í, 5, 0) + ,(5, 1, -3) 

10. a) U, v,z,„) = (1,6, 3,0) +/,(4. 11,7,0) + , 2 (0,0,0, 1) 
b) (x, v, --, „) = (, ; ' f , 4, \", 0) + /(4, —11,7, 22) 

14 8 3 


0' 

1 

-2 


16. 


I 0-1 0 1 ~ 

0 0 0 0 0 

0010-1 
0 10 0 0 

0 0 0 0 l 

0-3 0 1 0 _ 


2.21 Ejercicios varios sobre matrices (pág. 84) 


c :]■[: a 


j _ » donde b y c son arbitrarios y a es i 

cualquiera de la ecuación cuadrática a 2 — a + bc = 0. 
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■° - [-! :]■ c -!]■ [■: :]■ c 1- r: ::]• t: 

[-: -,]• [:: -',]• 

Capítulo 3 

3.6 Ejercicios (pág. 97) 

1. a) 6 b) 76 c) a 3 - 4a 

2. a) 1 b) 1 c) 1 

3 . b) (b — a)(c - a)(c - b)(a + b + c) y (b - a)(c - a)(c - b)(ab + ac 

4. a) 8 (b) (b - a)(c - a)(d - a)(c - b)(d - b)(d - c) 

c) (b - á)(c - a)(d - a)(c - b)(d - b)(d - c)(a + b + c + d) 

d) a(a 2 - 4)(a 2 - 16) e) -160 



n n /á 


/i h /a 


/i h h 

7. F' = 

gl <?2 <?3 

h x h 2 h 3 

+ 

g'i Ú gi 
h\ h 3 h 3 

+ 

gl <?2 g» 

h[ h' 2 h' 3 



/i /2 /3 


/1 

/2 /3 

8. b) SiF = 

/í /2 /3 

entonces F' = 

/í 

/2 /3 


/í /2 /3 


fi 

/2 /3 


10 det + = 16, det (+ -1 ) = — , A _1 


'i -î 
0 * 


3.11 Ejercicios (pág. 104) 

6. det + = (det 5)(det D) 

7. a) Independientes b) Independientes 


3.17 Ejercicios (pág. 116) 

' 109 113 -41 -13" 

-40 -92 74 16 

-41 -79 7 47 

-50 38 16 20_ 
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' 109 

-40 

-41 

-50' 


2 -6 

-4' 

1 

113 

-92 

-79 

38 

{-3 J w * 

-1 3 

-2 

C) 3Ò6 

-41 

74 

7 

16 


1 5 

2_ 


,- 13 

16 

47 

20. 


5. a) x = 0, y = 1, 


b) A = 0, 

= 2 b) jc 


c) A = 


-*i y -yi 2 ~ z i 

- x i y^-yi %-zi 

-*i y*-yi z 3 -zi 


y = 1, 

7 

JHi 

,*3 73 

(y-yù 


(x - AÍ!) 2 + (y - 7i) 2 (x - Xl ) 

(** - *i) 2 + (72 - 7i) 2 (*2 - *i) (72 - 7i) 

(x 3 - *i) 2 + (y s - 7 j ) 2 (x 3 - X] ) (y 3 - j t )J 

'x 2 + y 2 x 7 1' 

x î +7i *i 7i 1 
x l +7Ì *2 72 1 
+ 3 +7s x a 7s 1. 


Capítulo 4 


4.4 Ejercicios (pág. 125) 

5. Autofunciones : f(t) = Ct x , donde C ^ 0 

6. Éí polinomio constante no cero 

7. Autofunciones ;: /(<) = Ce t/X , donde C 0 

8. Autofunciones : f(t) = Ce^'* 7 - 1 , donde C 0 

0. Los autovectores pertenecientes a X = 0 son todos sucesiones constantes con límite 

a* 0 . 

Los autovectores pertenecientes a X = — 1 son todos sucesiones no constantes con 
límite a = 0 
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4.8 Ejercicios (pág. 132) 


Autovalor 

Autovectores 

dim E(\) 

1. (a) 1,1 

(a, b) 9 * (0,0) 

2 

(b) 1,1 

f(l,0),/ 9*0 

1 

(c) 1,1 

/(0,1), t 9 * 0 

1 

(d) 2 

/(1,1) / 9 * 0 

1 

0 

/(1, -1),/ *0 

1 

2. 1 +Jab 

/(Ví Jb), t 9 * 0 

1 

1 - Jab 

t(yja, - sTb), t 9 * 0 

1 


3. Si el campo de escalares es el conjunto de los números reales R, entonces solamente 
existen autovectores reales cuando senfl = 0, en este caso habrá dos autovectores iguales, 
X 2 = cosd, donde cosô = 1 o — 1 

En este caso todo vector no cero es un autovector dim E(\j) = dim ê(A 2 ) = 2. 

Si el campo de escalares es el conjunto de los números complejos C, entonces los auto- 
vectores son A, = cos0 + ísenô, A 2 = cosd—i sen0. Si senô = 0, son reales e iguales. Si 
sentì 9 * 0 son complejos conjugados distintos; los autovectores pertenecientes a A x son 
t(i, 1), t 9*0; los pertenecientes a \ 2 son f(l,i), t 9 * 0; dim E(\ L ) = dim E(A 2 ) = 1. 

« bl 

, donde b y c son arbitrarios y a es una de las soluciones de la ecuación 

c —a\ 
cfl = 1 — bc. 

\ a *] 

5. Sea A = I, y sea A = (a — d) 2 + 4 bc. Los autovectores son reales y distintos 

L c d\ 

si A > 0, reales e ìguales si A = 0, complejos conjugados si A < 0. 

6. a = b = c = d = e = f= 1. 


Autovalores 

Autovectores dim E(\) 

(a) 

1, 1, 1 

/(0, 0 , 1), / # 0 1 

(b) 

1 

/(1, -1,0),/ 9 * 0 1 


2 

/(3, 3, -1),/ 9 * 0 1 


21 

/(1,1, 6), / 9 * 0 1 

(c) 

1 

/(3, -1,3),/ 9 * 0 1 


2,2 

/(2, 2, -1), t 9*0 1 


8. 1, 1, —1, —1 respec 


para cada matriz 
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4.10 Ejercicios (pág. 139) 

2. a) Autovalores 1,3; C 

(b) Autovalores 6,-1; C = I I, donde ab ^ 0 

l5a -bj 

c) Autovalores 3, 3; si existe el no singular C, entonces C l AC = 3/, siendo 
AC = 3C,A =31 

d) Autovalores 1, 1; si existe el no singular C, entonces C~ X AC = I, siendo AC = C, 
A =1 

3. C = A~ X B. 

4. a) Autovalores 1, 1, —1; autovectores (1,0,1), (0, 1,0), (1,0, -1); 


=[?:]• 
c J- 


c = 


1 


[1 0 -lj 

b) Autovalores 2, 2, 1; autovectores (1,0, —1), (0, 1, —1), (1, -1,1); 

1 0 


0 1 -1 

-1 -1 1 

5. a) Autovalores 2, 2; autovectores /(1 


entonces C~ X AC 


■n 

Ll 2j 


■ a b- 

,0), t #0. Si C = , b A 0, 

-b 0 


r ° 

b) Autovalores 3, 3; autovectores /(1,1), í #0. Si C = , b A 0, 

la+b bj 

-n 


entonces C X AC 
6. Autovalores 1, 1, 1; autovectores /(1, —1, — 1), 


5.5 Ejercicios (pág. 146) 


Capítulo 5 


3. b) T" es hermitiana si n es par, si n es impar es anti-hermitiana 

7. a) Simétrica b) Ni lo uno ni lo otro c) Simétrica d) Simétrica 

9. d) Q(x + ty) = Q(x) + tÌQ(y) + f(T(x),y) + t(T(y), x) 


5.11 Ejercicios (pág. 154) 

1. a) Simétrica hermitiana 
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b) Ninguno de los cuatro tipos 

c) Anti-simétrica 

d) Anti-simétrica y anti-hermitiana 

í'cos 6 sen 8 

4. b) 

|_sen 8 — cos 0 

5. Autovalores A 3 = 0, 7 2 = 25; autovectores ortonormales u x = |(4, —3), u 2 = i(3, 4). 



6. Autovalores Aj = 2/, A 2 = —2/; autovectores ortonormales 


i i i p n 

„--^(,,-0, .,- 72 (i,o. J 

7. Autovalores A x = 1, A 2 = 3, A s = —4; autovectores ortonormales 

%-^C3,2,-.), *-^<3.-5.-1). 
1 3 3 ~ | 

VÏÔ VÎ4 V^5 

2 -5 

C = 0 —7= 

Vl4 V 35 

3 -1 -1 

_VÏÔ VÎ4 V35_ 

8. Autovalores A 2 = 1, A 2 = 6, A 3 = —4; autovectores ortonormales 


= i(0, 4, —3), «.=^(5,3,4), «a =^(5, -3, -4). 




4V2 

-3^2 


9. a), b), c) son unitarios b), c) son ortogonales 

11. a) Autovalores A 3 = ia , A 2 = — /a; autovectores ortonormales 


“■-72 0 ' - 
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5.15 Ejercicios (pág. 166) 
1. a) 


'4 2“ 

A = 

2 1 


b) K = 0, 2 2 = 5 c) Wl = — (1, -2), « 2 = -j= (2, 1) 


d) C = 


2. a) /4 = 

c) «! = 


V5"| 

'0 f 




3. 


b) ^ = f 4 = -è 

i i i ri n 

-7= (1,1), «2=-p(l. -1) d) C = —p 

V2 V2 V^Ll -lj 

a) ^ = _J] b) A 1 = V2, A 2 =-V2 

c) «! = Í(1 + V2. 1), «2 = f(-l, 1 + V2). donde / = I/V4 + 2V2 

donde t = 1/V4 + 2^2 


■■-U'a 


b) Aj = 50, A 2 = 25 
(4,3) d) C 


í 3 1 

L-4 3J 


b) A, =0, A 2 = f, A 3 = -1 


c) « 1 = 5 ( 3 , -4), 

P 1 *' 

è 0 i 

1 * o_ 

c) «3=^(0,1,-1) 

' V 2 2 °' 

-V2 1 V3 

-V 2 1 -V 3 . 

'2 0 2' 

0 1 0 

2 0-1 


V6 


1 


b) = 1, A 2 =3, A 3 = -2 
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c) «1 = (0,1,0), « 2 = — (2,0,1), «3 = ~ (1,0, —2) 
V 5 V 5 


"V 5 


V5 


3 2 4 
2 0 2 

4 2 3 


b) 2^ — = —1, = 


1 


C) Hl = V2 (1 ’°’ _1) ’ " 2 = ^/1 (-1,4> ~ 1} ’ “3 =3 (2,1,2) 


8 . 

9. 

10 . 

11 . 

12 . 

13. 


d) C-p, 

3V2 


3 -1 2y/2 

0 4 y/2 

-3 -1 2,/2. 

Elipse;. centro en (0,0) 
Hipérbola; centro en(-f, -|) 
Parábola; vértice en(/ 6 -, —1|) 
Elipse; centro en (0,0) 

Elipse; centro en (6, —4) 
Parábola; vértice en (^, ii) 


14. Elipse; centro en (0,0) 

15. Parábola; vértice en(|, f) 

16. Elipse; centro en( -1, |) 

17. Hipérbola; centro en (0,0) 

18. Hrpérbola; centro en ( — 1,2) 

19. -14 


5.20 Ejercicios (pág. 174) 

8. a = ±iV3 13. (a)> (b)> y (e) 


6.3 Ejercicios (pág. 178) 

1. y=e 3x -e 2x 
2- y=îx 2 +%x 3 

3. y = 4 cos x — 2 cos 2 x 

4. Cuatro veces la cantidad inicial 

5. f(x) = Cx\ or f(x)=Cx 1/n 


Capítulo 6 

6. b) y = e ix - e~ x3/3 

7. y = c ie 2x + c 2 e~ 2x 

8. y = Cl cos 2* + c 2 sen 2x 

9. y = ^(cy cos 2x + c 2 sen 2x) 

10. + = e~ x (c t + c 2 x) 


11. k = n 2 w 2 ; / A .(x) = Csen/urjc (« = 1,2, 3,...) 
13. a) y" - y = 0 

b) /' - 4/ + 4y = 0 

c) y"+y'+iy = 0 

d) j" + 4y = 0 

e) / - y = 0 
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14. y = \ý6, y" = -Ì2y = -4/6 


6.9 Ejercicios (pág. 190) 


1. 

y = 

Ci + c 2 e~ x + c 3 e 3x 

3- J 

= C 1 + 

+ c 3 x)e 2x 

2. 

y = 

<?i + c 2 e x + c 3 e _x 

4. j 

= (Cj + c 2 x 

+ c 3 Jt 2 )e x 

5. 

y = 

(Cj + c 2 * + c 3 jj 2 + c^e - * 




6. 

y = 

Cje 2 ® + c 2 e _2x + Cj cos 2jr + c 4 sen 2jc 



7. 

y = 

e' /2x (c 1 cos V2JC + c 2 sen /2x) + e 

“ V ^(c s c( 

ÌSyfÌx + c 4 

sen /2jt) 

8. 

y = 

c^e* + e- x/2 (c 2 cosiv^x + c 3 sen|,/3jt) 



9. 

y = 

e x [(c 4 + c 2 x) cos Jt + (c 3 + c 4 Jt) se 

njt] 



10. 

/ = 

(Cj + c 2 x) cos JC + (c 3 + c 4 jc) sen Jt 




11. 

y = 

Cj + c 2 x + (c 3 + C 4 Jt) cos yj2x + (c 5 + C 6 Jt) 

sen /2 jc 


12. 

y = 

Cj + c 2 x + (c 3 + c 4 *) cos 2x + (c 5 

+ c t x) sei 

n2jt 


13. 

/(*) 

= (e mx ~ cos »ijt - sen mjt) 




15. 

a) 

_y <4) - 5y" + 4y = 0 

e) 

j< s) - 2_y (4) + ý" = 0 


b) 

/" + 6 y" + 12/ + 8+ = 0 

0 

/ 4 + 8/ 

+ 33/ + 68/ + 52j = 0 


c) 

/ 4) -2/" +/ =0 

g) 

j <4) - 2/ 

+ y = 0 


d) 

yli) _ 2/" +/ = 0 

h) 

/«> + 4 y" 

= 0 


6.15 Ejercicios (pág. 204) 

1. = -2x - x 2 - $x? 

2. y t = ixe 2x 

3. y t = (jc - fle* 

4. = JsenA: 

9. 50jj = (11 - 5*)«* sen 2* + (2 
10. Jx =~(f*+ f* 2 + -àx 3 )e~* 

x m e* x 

12 ' 

15. b) 2 D c) 3D 2 d) nD "- 1 

1 r e-* 1 f e* 

16. y = /le* + fie-* “ à 

17. j = (/4 + Jx) sen 2x + (B + J log |cos 2x|) cos 2x 

18. y = /4e* + Be~ x + |ìec jc 

19. y = (A + Bx)e* + e'* - xe* j e‘ x d :c + e* J jte* 1 </jt 


5. = \x 2 e* + e 2x 

6. yi =\xe* 

1 . y x = * cosh * 

8 . = ~2ï xi e~ x 

- 10jc)e*cos2x 
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20. y - -£Ìog|*| + ^ j^—dx~^e 2x J~dx 

1 Ç e~* x 

+ 24 e I ~ dx + AeX + B e 2x + Ce^ 


6.16 Miscelánea de ejercicios sobre ecuaciones diferenciales lineales (pág. 206) 

1. u(x) = 6(e ix - e- x )/5 ; v(x) = e x - e^ 

2. u(x) = %e 2x ~* sen 5* ; v(x) = §<r 2x ' I 'sen 3 jc 

3. u(x) = e - x *; Q(x) = 4x 2 + 2 

5. y = (A + Bx s )e x + (x 2 - 2x + 2)e 2x 

6. y = Ae ix J e~ ix - x3 ' 2 dx + Be ix 

7. y = Ax'A + Bx~'A 

8. y = Ae x + Bx 2 e~ x - x 

9. y = A(x 2 -2) + Bjx 

10. y = x- 2 [A + B(x - 1)3 + $x* + §x 2 - ix + i - (X - 1)3 log \ x - 11] 

11. « = 1,-1; y = [Ae°™ + Be-°M]lx ' 

6.21 Ejercicios (pág. 218) 

2 - /(•*) = «i(aí) (a = 1) 

3. a) A = (a - b)/2, B = (a + b)/2 

d f dy] 

b) 7t [«* - ^ Tt\ ~ “ (a + = 0> donde a = 1 0 - 2 . y * = (f + i)/2 

4. -,(-> =. + 2 

- w - ^ + 2 ( -'>- 2 " — ~ IK " ~ ( £ + ' !r'^ + 0 *" H P4ra todo x 

5 ' “ * + 2 (3m + 2|ì3m - 1) 4 - 5 para '°' Jo *■ 

= + '| 1 + ^ a 3 "! para íodo x * 0 

* _ J l , v(« -2)(oc -3) -(a -n - 1) \ 

6 ' y \6 + Z nl(„ + 3)!-*”) paratodo * 

11. b) f(x) = iP 0 (x) + ±P 2 ( X ) + -^(x) 

15. b) 
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6.24 Ejercicios (pág. 231) 

5. 

9. a) y = * , '‘[c 1 / H (f*«) +<*/_„($*«)] 

b) y = x 2 ) + c 2 /_, í (ix 2 )] 

c) y = x , '»[c 1 ./ a (2ouc l +™' 2 ) +c 2 /_ HI (2occ 1 + m/2 )], donde « = l/(m + 2), con tal que 
\j{m + 2) no sea entero; si no, sustituir la / correspondiente por K 

d) y = x^fa/.d* 2 ) + c,J_ x {\x 2 )\, donde « = ^2/8 

10. y = g* satisface x 2 y" + (1 — 2 c)xy’ + (a 2 b 2 x 2b + c 2 — a 2 6 2 )_y = 0 

a) = jc-^[ Ci / 5 (2jc^) + c 2 á: 5 (2x , +)] 

b) y = x-*1 Cl J SA (x) + C2 /_ M W] 

c) _y = jr-icj/id^) + c^xCf^)] 

d) y = xfo/o(2xK) + c 2 tf 0 (2**)] 

11. a =2, c = 0 

12. 7 = 2 ^F*" ! y =/ o( 2 ^ ,/í > si * > 0 


13. b = (p 0 — a 0 )/a 0 , c = ? 0 /a 0 

14. j = x 1 '* 



16. m 0 (x) = cos x; k x (x) = i — | cos x — | cos 2x 

Capítulo 7 

7.4 Ejercicios (pág. 241) 

3. b) (P k Y = ^ pmp’pk-l-m 

7.12 Ejercicios (pág. 251) 

1. a) A- 1 = 21 - A , A n = nA — (n — 1)/ 

b) e*- 4 = e‘(l - t)I + te*A = 
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a) A- 1 = |/ - \A, A n = (2" - 1 )A - (2" - 2)1 

b) e tA = (2e‘ - e 


= (2e‘ - e*)I + (e 2 ‘ - e‘)A = ° 1 

[e°‘-e‘ e*‘j 

4 

:] 


a) A- 1 = A, A n 

b) e tA = (cosh t)l + (senh t)A 


a) A~‘ 


= A, A n -- 


[ cosh t senh í"l 
senh t cosh /J 
1 + (- 1 )" , 1 - (- 1 )" 


-/ + - 


b) e‘ A = (cosh t)I + (senh t)A 


5. b) e‘ A 


r c 


_ \ et 0 

' L 0 «*. 


r cos bt sen 6/1 
—sené/ cos 6/J 
7. e A <‘> =I + (e- 1 )A(t) ; (e A <‘>)’ = (e - 1 )A’(t) = |° 

L» 


e A(t >A'(t) = 


; A'(t)e A( ‘> = 


ro e 

L° °_ 

8. a) A n = O si n £ 3 

b) e tA = I + tA + ^ t 3 A 2 

9. v a) A n = A si n £ 1 

b) e‘ A = 1 + (e* - 1 )A = 


-1 / / + ^-| 

0 1 / 

0 0 1 

e‘ - 1 e 1 
e‘ e‘ 


10. a) A 3 = 4A 2 - 5A + 21; A n = 

~e 2t 0 0' 

0 e‘ 0 


2“ 0 0' 
0 1 0 


11. e* 


= I + tA + \t 2 A 2 



Soluciones a los ejercicios 


„_[«* e „ eA J‘' <«-»']. 

o i j’ L° 1 J’ L° l 


7.15 Ejercicios (pág. 260) 

1. e tA = IQe* - e 3t )I + ' 2 (e 3t - e*)A 

2. e tA = (cosh yj5 t)I 4—— (senh^/5 t)A 

V 5 

3. e tA = le ( {(t 2 - 2t + 2)1 4- (-2 1 2 + 2t)A + t 2 A 2 ) 

4. e tA = (3e _t — 3e“ 2f 4- e~ 3t )I + (fe -1 — 4e _2f 4- %e~ 3t )A 4- (\e~ l — e~ 2t 4- \e~ 3t )A 2 

5. e tA = (4 e t _ 3e 2( + 2te 2l )I 4- (4e 2f - 3/e 2f - Ae l )A + (e f - e 2f 4- re 2t )/í 2 

6. e M = (4e f — 6e 2t 4- 4e 3í — e 4t )/ 4- (—' l 3 3 e f 4- \ B ~e 2í — le 3t 4- X e e u )A 

4- (fe 4 — 4e 2t 4- fe 3t — e u )A 2 + ( — èe f 4- fe 2f — fe 34 4- e e u )A 3 

7. b) e tA = ge xt {(6 - 6 U 4- 3A 2 í 2 - )?t 3 )l 4- (6/ - 6A/ 2 4- U 2 t 3 )A + (3 1 2 - 3/.r 3 )A 2 

+ r c t + 2c -i r r 2c i ~ c 2 r 

8. y x = CiCOsh y/5 t 4- -j =—senh ^5 t, y 2 = c 2 cosh ,/5 t 4-—senh^/5/ 

V 5 v 5 

9. y x = e f (cos 3/ - sen 3/), ^ 2 = e f (cos 3/ — 3 sen3/) 

10. = e 2t 4- 4/e 2f , y. 2 = —2e f 4- e 2f 4- 4/e 2f , y 3 = —2e f 4- 4e 2f 

11. y x = c x e 2t , y 2 = e 2 e‘, + 3 = (c 2 / 4- c 3 )e f 

12. y x = 3e _f - 3e“ 2f 4- e~ 3t , y 2 = -3e _f 4- 6e _2f - 3e“ 3f , = 3e~ f - 12e“ 2í 4- 9e _3f 

13. y x = e 5t 4- 7e _3f , y 2 = 2C 54 — 2e- 3t , + 3 = — e 5f 4- e~ 3t 

14. y x = -\e l 4- e 2f 4- fe 3f , y 2 = e 2t + e 3f , y 3 = e 3f , y 4 = e 4f 

15. y x = 2e 2t — 1, j 2 = 2e 2f - / - 2, + 3 = 2e 2t , y t = e 2t 


7.17 Ejercicios (pág. 264) 

2. C) Ji = (6 - l)e* 4 2(c 4 1 - b)xe x + 1, j 2 = ce* 4- 2(c 4- 1 - b)xe x 
4. = -fe f - fe 4f 4- fe 2f , y 2 = fe f - fe 44 4- fe 2t 


5. a) B 0 
b) B = 


B x = ^5, fl 2 

t! (/4 -1 ) m+1 C 


a) y(/) = / 4 tA +- t 2 A 2 +~J 3 A 3 


’)*• 


3 rr. 

donde B = —6A~*C = - 

128 i 


Esto nos da la solución particular y x = y 2 = —rfìT “ — T$t 2 — )t 3 

b) yi = y 2 = -rfí - -rV - tV 2 - ií 3 4- if|e 4f 


7. E = B, F = -(AB + C) 

8. a) y x = —cos2/ — \ sen 2/, y 2 = —Jsen2/ 
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Soluciones a los ejercicios 


b) Ji = 2 cosh 2t + |senh2í - cos 2t - \ sen2/, j 2 =cosh 2/ + |senh 2t- Jsen2í 
9. jjO) = e 2x + é 3 * - e 1 , y 2 (x) = -2e** - e 3x + 3e x 

10. yi (x) = 2 %e* - he ïx + (c, - í,òoC" 4x + (35 - q - c 2 )xc- te , 

+2(->c) = he x + he 2x + (c 2 - Uu)e~ ix + (c^ + c 2 - iè).**- 4 * 

11. + x (x) = e~ 4x (2 cos x + senx) + Mc* - f? , + 2 (x) = e- 4 *(senx + 3 cos x)~he x +i% 

12. yi (x) = e~ x (x 2 + 2x + 3) + x 2 - 3x + 3, j 2 (x) = e x (-2x - 2) + x, 

+ 3 (x) = 2 e~ x + x - 1 


7.20 Ejercicios (pág. 272) 

4. c) Y(x) = e'e'^AB 

5. Si A(x) =2 x*ví s , entonces Y(x) = B + xC + ^ x^'fij., 
donde (A: + 2)(A: + l)fi*. 2 = J <4 r 5 t _r para A: > 0. 


7.24 Ejercicios (pág. 283) 

1. a) Y(x)=e x 

b) Y„(x) = 2e* - ^ Y\ si " es impar ; Y n (x) = ^ s» « es par 


2. 


x 5 

20 


x* 

160 + 4400 


3. Y 3 (x) 


x 4 x’ x 4 " 
4 + 14 + Î6Ô 


x 3 4x 7 8x* 184x 14 4x 13 

3 + 63 + 405 + 51975 + Ï2285 


a) y 2 (x) = 1 

b) M =2; 


a) W=x + T +-+_ 
x 3 2x® 

d) Y(x) = tg x = x + — + — 


38x 9 134X 11 4x 13 

f 2835 + 51975 + 12285 
17x 7 62x 9 

f 3Î? + 2835 


59535 
para |x| < — 


^ , , , 3x 4 6x 5 3x 7 3x 8 

Z 3 (x) = 3x 2 + —+ —+ — + — 
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Soluciones a los ejercicios 
jc 4 jc 6 2x 7 x 9 

h 12 + 6 + 63 + 72 ’ 


10. d) Y n {x) = 0 ; lim y„(jf) = 0 



X 2 

si JC >0 

e) 

Y n {x) = 

; lim y„(x) 


i-x 2 

si X < 0 n —*-oo 


2x” 


f) 

Y *W—pri 

lim y„(x) = 0 


( X 2 

si * > 0 

g) 

YnM = . 

; lim K(x) 


-X 2 

si X < 0 ».-<» 


í jc 2 si x > 0 
(-jc 2 si x<0 

í 5i 

(-jc 2 si x < 0 


8.3 Ejercicios (pág. 300) 


Capítulo 8 


2. Todos abiertos excepto d), e), h), y j) 

3. Todos abiertos excepto d) 

5. e) Un ejemplo es la colección de todas las 2-esferas 8(0; 1/fc), donde fc=l,2,3,... 

6. a) Abierto y cerrado b) Abierto y cerrado c) Cerrado d) Abierto e) Cerrado 

f) Ni abierto ni cerrado g) Cerrado h) Ni abierto ni cerrado i) cerrado 
j) cerrado k) ni abierto ni cerrado 1) Cerrado 

8. e) Un ejemplo es la reunión de todos los conjuntos de la forma S*= {x | ||jc|| <1 —1/fc} 
para fc = 1,2,3,... Su reunión es la esfera abierta B(0; 1) 

10. No 


8.3 Ejercicios (pág. 306) 

1. a) Todo (x, y) 

b) Todo(x,j) * (0,0) 

c) Todo (*, y) con y ^ 0 ^2 n 

d) TodoÍJC, y) con y * 0 y — ^ + kir (fc = 0, 1, 2,. . .) 

e) Todo(x, y) con x # 0 ? 

f) Todo {x, y) (0, 0) 

g) TodoÍAJ, y) con xy ^ 1 

h) Todo(Jt, y) jì (0, 0) 

i) Todo(AJ,j) (0,0) 

j) Todo(x, y)con y ^0 y 0 <, x <, y o y £ x <, 0 

5. lim /(x, y) no existe si x ^ 0 

6. (T°- m 2 )j{l + m 2 ) ; No 

7. y = \x 2 ; / no es continua en (0, 0) 



Soluciones a los ejercicios 
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8 . 

8.9 

1. 

2. 

3. 

4. 

5. 

6. 


11 . 

12 . 

13. 

14. 

15. 

16. 

17 . 


/(0, 0) = 1 
Ejercicios (pág. 312) 

= a-y 

a) f(x\y) =4 \\x\\*x-y 

b) Todos los puntos de la recta 2x + 3y = 

c) Todos los puntos del plano x + 2y + 3z = 0 
/'(*; y)=x- T(y) + y • r(jt) 

df df 

fa = 2x + f cos (xy) ■> 2 y sen(xy) + xy 2 cos (xy) 

df , df 

sx = + / )/á ; r y = yKxì + 

|£ = j 2 /(x 2 + /) 3 ^ ; 0 = -x_y/(x 2 + /)M 

df df 

jfc = ~2yl(x — y ) 2 ; f y =2x/(x-y) 2 

D k f(x) = aj., donde « = («!,..., a n ) 


i>,/(x) =2|«^ 

5-4«*-aVî %-*/-**} 

df _ 2x df 2y 

dx ~ x 2 + f ’ dy = x 2 +/ 


df = _2x 
9x j 


(* 2 ); 


£ 

9y 


9/ 2x x 2 3/ x 2 2 x 2 

3x“ j sec j ’ 3j“ / sec j 

g / J . d/ 1 

3x x 2 + j 2 ’ 3/ x 2 + / 


3/ _ 1 + / .3/ 1 + x 2 

3x 1 + x 2 +/ + x 2 / ’ 3/ “ 1 + x 2 +/ + x y 



d l 

3x 




£ 

3j 


= 2jx* z log x 


df sfx_ 
dy tysly - x 



Soluciones a los ejercicios 
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19. a = b = 1 

22. b) Un ejemplo es f(x) = x • y, donde y es un vector dado no nulo 


8.14 Ejercicios (pág. 320) 

1. a) (2 x + ŷ 3 cos xỳ)i + (2 y sen xy + xy 2 cos xy)j 

b) e* cos yi — é* sen yj 

c) 2 xfzH + 3 xyz*j + 4 x 2 fz*k 

d) 2xi — 2 yj + 4 zk 

x 2x # 4y 6z 

C) x 2 + 2/ - 3z 2 ' + x 2 + 2/ - 3 z* J ~ x 2 + 2\y 2 - 3z 2 * 

f) y*x v ‘~ 1 i + zy‘~ 1 x v ‘ log xj + y“x v ‘ log x log yk 

2. a) -2/Vô 

b) 1/V6 

3. (1,0), en la dirección de /; (—1,0), en la dirección de —i 

4. 2i + 2j ; V 

5. (a, b, c) = (6,24, -8) o (-6, -24, 8) 

6. E1 conjunto de puntos (x, y) de la recta 5x — 3y = 6 ; V/(a) = 5i — 3y 
8. c) Sí 

d) f(x,y,z)=Hx 2 +y 2 +z 2 ) 

11. b) implica a) y c); d) implica a), b), y c); f) implica a) 


8.17 Ejercicios (pág. 327) 


L b) F"(t) = g (X'(t )] 2 + 2 X'(t)Y'(t) + 0 (Y '( t )] 2 + ^X"(t) + | y"(t) 

2. a) í' , (f) = 4f 3 + 2f; f"(f) = 12f 2 + 2 

b) F'(t) = (2cos 2 f — l)c coa<K *’ < cos(cos fsen 2 /) + (3sen 3 / — 2senf)e c08ísaní sen(cos ísen 2 f) ; 
F"(t) = (5 cos 6 f — 3 cos 4 f - 4 cos 3 f — cos 2 f — 4 cos f)e c08 ( sènt cos (cos fsen 2 f) 

+ (14sen 3 f — 12sen® f —4senf + 7 cos f — 9cos s f)e co8tsont sen(cos fsen 2 f) 


0 F'(t) 


2e 2t exp (e 2í ) 
1 + exp (e 2t ) 


2e~ zt exp (e~ 2t ) 

1 + exp (e~ 2t ) ’ 


donde exp (u) = e u ; 


F"(t) = 


4[1 + e 2t + exp (e 2t )]e 2t exp (e 2t ) 
[1 + exp (e 2í )] 2 


4[1 + e _2t + exp (e _2t )]e~ 2t exp (e _2t ) 
[1 + exp (e _2t )] 2 


3- a) -f 

b) x 2 — y 2 

c) 0 

4. a) (1 + 3x 2 + 3 y 2 )(xi + yj) — (x 2 + y 2 )'^k, o cualquier producto de éste por un escalar 
b) cos 6 = — [1 + (1 + 3(x 2 + j 2 )) 2 ] - ’^; cos 0 —\\ll cuando (x, y, z) -> (0, 0, 0) 
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5. U(x,y ) = \ log (x 2 + y 2 ) ; V(x,y) =arctan (yjx) 

6. b) No 

8. x/x 0 + y/y„ + zjz Q = 3 

9. x + y + 2z = 4, x -y-z=-l 

10. c = ±V3 


8.22 Ejercicios (pág. 336) 

df 

1 • b) ^ = —2x sen (x 2 + y 2 ) cos [cos (x 2 + y 2 )]e" n I® 08 <** + v 1 )} 

d l = l Jl Jl. = Jl 

dx 2 du + 2 dv ’ dy 2 du + 2 dv 
. dF = dfdx ^dfdY _ dF_dfdx dfdY 

a ds dx ds dy ds ’ dt dx dt + dy dt 

êPlf _ d 2 f dXdX ^ d 2 f /dXdY ^ dXdj'\ dydYdY df d*X df d 2 Y 
dsdt dx 2 ds dt dt + dt ds} + dy 2 ds ~dt + dxdsdt + FydTdi 


J = 1 df d 2 F d 2 f 

ds dx + 1 dy ’ dt ~ dx + S dy ’ Hï 2 ~ dî? ' 


:f »/ , 

dxdy 


' df’ 


, !1_ , 2 d 2 f d 2 F d 2 f d 2 f d 2 f df 

dt 2 dx 2+2s dxdy +s df’ d7dt = d^ 2 + (s + t) d7^ +st dp + ^ 


h1 d l = t <lA d l. d _l_ 1 *3/. &F 

ds dx tdy'dt S dx t 2 dy ’ ds 2 


lí- 

dt 2 = 


lli_ytlL tlí H. d * F 

dx 2 t 2 dx dy + t 4 dy 2 + t 3 dy ’ ds dt " 


y 1 2 */ 9y 

* 2+ dxdy + t 2 dy 2 ’ 

JlL-JlL + l-Jl 

dx 2 t 2 5y 2+ dx t 2 dy 


C ) — = ìl + ìl. J = Jl. U _ 1 3 2 / 1 d 2 f 

ds 2dx 2 dy’ dt 2 dx + 2 dy ’ dfdt 4 dx 2 + 4 df ’ 

— = - 1L . í JLL i IL ll _ 1 <LL 1 d L ld *f 

ds 2 4 dx 2 2 dx dy + 4 dy 2 ’ dt 2 ~ 4 dl 2 ~ 2 dxdy + 4 df 


d 2 g> 

H? " 


e d2 J 


JJL dV_ 

\ 3 jc dy dy dx) dy 2 ’ 


3 2 <p d 2 f d 2 f d 2 f d 2 f 

dfdè-- r cos 0 sen e d? 2+rCOS °dïdy- rsen * 6 dykc +rcosd sen 0 1 


1 


1 




Soluciones a los ejercicios ï 

_ dfdX dfdY dfdZ dF _dfdX dfdY dfdZ _ 
dx dr + dy dr + dz dr ’ ds dx ds + 8y ds + dz ds ' 

_dfdX dfdY dfdZ 
dx dt + 3 'y dt + dz dt 

d I-?l ± d l + , d l. d I - d l_, d lJl. d l-l + ll_ d l 

dr dx dy dz' ds dx dy dz ’ dt dx dy dz 


# ìMI-f- 


7 _3fdX dfdY dfdZ dF_dfdX dfdY dfdZ 

dx ds + dy ds + dz ds ’ dt dx dt + dy dt + dz dt 

, d -l = r M±'>Sz,‘>t d l. d l = >11 -, t d l + >11 

ds dx dy dz ’ dt dx dy dz 

, Uljl^.l. d l_ d l d l^ 1 

ds dx dy dz ’ dt dx dy S dz 

' = SfdX dfdY' dF _dfdX dfdY, dF _ dfdX dfdY 

dx dr + dy dr ’ ds dx ds + dy ds’ dt dx dt + 8y dt 
dr dx ds 8x ’ dt By 

d Ul + >ll. d Ul + >ll. d l- d l + Jl 

dr 8x dy ’ ds dx dy ’ dt 8x + 8y 
dF_ ldf dF_^rdf 1 8f dF _ -sdf 

dr s dx’ ds s 2 dx t dy ’ dt ~ t % dy 

f(x, y, z) = xi + yj + zk, más un vector constante cualquiera 
f(x, y, z ) = P(x)i + Q(y)j + R(z)k, donde P, Q, R son tres funciones cualesquiei 
e satisfacen P' = p, Q' = q, R' = r 



r gx+2v 

2e*+ 2v 1 

r 1 Av 9 w 2 ~\ 

14. a) 

Df(x,y) = 1 

; 

; Dg(u, v, w) = 


|_2 cos (y + 2x) 

cos (y + 2*)J 

L-2« 2 0 J 

b) 

h(u, V, w) = e“+2®’+3“ , +4®-2u í 

i + sen (2v - « 2 

+ 2 u + Av 2 + 6w 3 )j 


15. a) Df(x,y, z) = 


2 1 2z 


Dg(u, v, w) = 





782 


Soluciones a los ejercicios 


b) h(u, v, w) = (iAV + w 2 sen v + u 2 e v )i + (2 uv 2 w 2 


c) Dh(u, 0, w) 


"2 u w 2 + u 2 0 
_4« 3 w 2 + 2« 4 0_ 


+ iâe 2v )j 


8.24 Ejercicios varios (pág. 342) 


1. Un ejemplo: f(x,y) = 3x cuando jc =y,f(x,y) = 0 para los demás valores derey 

2. DJ(0, 0) = 0 ; D 2 f(0, 0) = -1; D 21 f(0, 0) = 0 ; D 12 f(0, 0) no existe 

3. a) Si a = («j, a 2 ), entonces f'(0; a) = «jj/af si «i rt 0, y f'(0; a) = 0 si a x = 0 
b) La función / no es continua en el origen 


4 ' | f -=\ e ~ xv ^y^; Y y =\e- xy x' A y- iA 

5. F"(t) = g [A"(/)] 3 + 3 [X'(t)] 2 Y'(t) + 3 ^ X'(t)[Y'(t)f 


+ ^ u"wr + 3 fèX'w(t) + 3 ^ [jr"(í)y'(í) + x'm"(m 
d 2 f , df df 

+ 3^mr(0 + ir W + Ir( ( ), 


suponiendo que las derivadas parciales mixtas no dependen del orden de derivación 

6 . 8 


k- d l JL 


k Jl 

dv 


&g 




d 2 f df 

- uv 4 + t x (b) 


dx U dy V ’ du dv uv dx 2 

i, b = -è 


10. a) <p'(t) = A'(t) ! e BU 'flA(t),y] dy + B'(t)\f» f(x, B(t )] dx 
b) <p'(t) = 2te t! (2e‘ 2 — e a — e c ) 

13. Una esfera con centro en el origen y radio J 2 

14. f(x) =x 2 


’dxdy 


9.3 Ejercicios (pág. 349) 

1. f(x,y) =sen( x -iy) 

2. /(^r.j) = e *+5»/2 _ i 

3. a) u(x,ỳ) = x 2 y 2 e** 

b) v(x,y) = 2 + log 


Capítulo 9 



Soluciones a los ejercicios 
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5. A - B - C - 1, D = -3; f(x,y ) = 9^(3* + y) + <p 2 (x -y) 

6. G(x,y)=x-y 

9.8 Ejercicios (pág. 368) 

1. dX/dv = (1 +. xu)/(x -y);dY/du = (1 - yv)/(x -y);dY/dv = (1 + yu)/(y - x) 

2. dX/dy = -(1 + xu)/(ì + u); dV/du = (1 — yv)/( 1 + yu) ;dV/dy = (1 - x)/(l + u) 

3 3X d(F, G) j d(F , G) dY d(F,G) I B(F,G) dY d(F, G) ld(F, G) 

dv d(y,v)fd(x,y) ’ du d(u, x) / d(x, y) ’ dv ~ d(v,x) / d(x,y) 

4 ' T = ± (24/ - Ayjl j + 3^7 A) 

5. 2i + j + 3 k,o cualquier producto no nulo de éste por un escalar 

6. dx/du = 0, dx/dv = n/ 12 

8. n = 2 

9. 9//a* = — 1 / (2y + 2z + 1); df/dy = -2(y + z)/(2_y + 2z + 1) ; 
d*f/(dx dy) = 2/(2_y + 2z + 1)» 

10. dhj(dx dy) = [sen(* + y) cos 2 (y + z) + sen (y + z ) CO s 2 (x + y)]/ cos 3 (_y + z) 

3/ ÛjF + 2*£> 2 F 9/ D x F + 2yD 2 F 

dx ~ D y F + 2zD t F ’ dy D^F + 2zZ) 2 F 

12. D t F =f'[x + g(y)]; D 2 F =f'[x +g(yj]g'(y) ; D 21 F = f"[x + g(y)]; 

D^F = f"[x +g(y)]g'(y); D 2 2 F =f"[x +^(j)][^'(+)] 2 +f'[x +g(y)]g"(y) 

9.13 Ejercicios (pág. 381) 

1. Mínimo absoluto en (0, 1) 

2. Punto de ensilladura en (0,1) 

3. Punta de ensilladura en (0, 0) 

4. Mínimo absoluto en cada punto de la recta y = x + 1 

5. Punto de ensilladura en (1, 1) 

6. Mínimo absoluto en (1,0) 

7. Punto de ensilladura en (0, 0) 

8. Punto de ensilladura en (0, 6) y en (x, 0), para todo x; mínimo relativo en (0, y), 

0 < y <6; máximo relativo en (2, 3) y en (0, y) para y < 0 e y > 6 

9. Punto de ensilladura en (0,0); mínimo relativo en (1,1) 

10. Puntos de ensilladura en (mt + n/2,0), siendo n un entero 

11. Mínimo absoluto en (0, 0); Punto de ensilladura en (-j, -|) 

12. Mínimo absoluto en (-^g, - 2 ®-); máximo absoluto en (1,3) 

13. Máximo absoluto en (n/3, ir/i); mínimo absoluto eli (2ir/3, 2ir/3); máximo relativo en 
(rr, 7r); mínimo relativo en (0,0); punto de ensilladura en (0 n) Y (n 0) 

14. Puntos de ensilladura en (1,1) 

15. Máximo absoluto en cada punto de la circunferencia x 2 + y 2 = 1 ; mínimo absoluto 
en (0, 0) 
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Soluciones a los ejercicios 


17. c) Máximo relativo en (2,2); no existen mínimos relativos; puntos de ensilladura en 
(0,3), (3,0), y (3,3) 

18. Máximo relativo £ en (^, £) y (—J, — J); mínimo relativo — Jen(£, — J) y ( —ì, i); 
puntos deensilladura en (0,0), (±1,0), y (0, ±1); máximo absoluto len(l, —1) y 
( — 1, 1); mínimo absoluto —len(l,l) y (-1,-1) 

19. a) a = 1, b = -i 

b) a = 6 log 2 — 3w/2, i = tt - 3 log 2 


21. Sea x* =X * ~ x *- Entonces a = (2^“*)/(2 W< )’ 

y b = y* — ax* 

22. Sea x* = - 2 , J*=- 2 z * = " 2 z <’ =;c í ~ x * * v i — ,y pongamos 

. I2-T2H ” 


2 “-». 2 t! 


, considerándose las sumas para i = 1,2,...,«. Entonces 


, c = z* — ax* — by* 


M 

í 

M 

jc 

1 

. b = T 

2"* 2- 

\z ViZi 2 r< l 

A 

2- 2" ! 


25. Autovalores 4, 16, 16; mínimo relativo en (1,1,1) 


9.15 Ejercicios (pág. 387) 

1. E1 valor máximo es 'A; no tiene mínimo 

2. E1 máximo es 2; el mínimo es 1 

3. a) E1 máximo es en (b(a 2 + b 2 Y~ l/í , a(a 2 + b 2 )~ l/í ) ; el mínimo es 

- + * 2 en (~b(a 2 + b 2 )-*, -a(a 2 + b 2 r' A ) 

ab 

b) E1 mínimo es a 2 b 2 l(a 2 + b 2 ) en(^y 2 , 5 no tiene máximo 

4. E1 ipáximo es 1 + ^2/2 en los puntos (nn + vr/8, nn - tt/8), siendo n unentero cual- 
quiera; el mínimo es 1 — -^/2/2 en (nn + 5nj8, nn + 3nj8), siendo n cualquier entero 

5. E1 máximo es 3 en (i, — f, f); el mínimo es — 3en(— j, f, — |) 

6. (0,0,1) y (0,0, -1) 
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8 . ( 1 , 0 , 0 ), ( 0 , 1 , 0 ), (- 1 , 0 , 0 ), ( 0 , - 1 , 0 ) 

a a b b c c / a b c \ 

9 ' (a + b + c) a + b+c at \a+i+c’fl+/>+c’a+6+c/ 

10. abcjìll 

11. 5 logc + 3 log sj 3 

12 m 2 _ A + C - J(A - Cf + 4fí 2 
2(+C - fl 2 ) 

13. (4 ± 75)/V2 

14. El ángulo es cr/3; anchura del fondo c/3,e! área máxima esc 2 /(4>y3) 


Capítulo 10 


10.5 Ejercicios (pág. 399) 

1. -il 

8. 

1 

2. -2 W fl 2 

9. 

-¥o- 

3. 3 1 ? 

10. 

— 27T 

4. I 

11. 

0 

5. 0 

12. 

(a) -Isjlrr 

6. 40 


(b) ->r 

7. â 6 â 




10.9 

Ejercicios (pág. 403) 



1. 

¥ 

8. 

256fl 3 /15 

2. 

2fl 3 

9. 

277 2 a 3 (l + 2 t7 2 ) 

3. 

fl = QclD'A 

10. 

[(2 + / 0 2 )^ - 2V2]/3 

4. 

0 

12. 

momento de inercia= 4fl 4 

5. 

87r(senâ — cos 0) 

13. 

2-/3 

6. 


14. 

600 - 36^2 - 49 log (9 - 4^2) 

770/4 

64(6^2 + log (3 + 2^2)] 


— V2 


6a/> 2 _ 6nab 2 

7. 

15. 

X 3a 2 + 4 t 7 2 Z> 2 ’ • P ~ 3a 2 + 4+ 


16. 4 = (fl 2 + ^[tta 4 + (4^ - Trjï)á l b 2 + 32^/5] 

4 = (a 2 + 6 2 )^M 4 + (4 tt 3 + 7r/ 2)fl 2 /> 2 + 32+>/> 4 /5] 
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10.13 Ejercicios (pág. 409) 

1. Todos excepto (/) son conexos 

6. a) No conservativo 

b) (2e 2 * - 5e* - 5w - 3)/10 

7. b) 3 

8 . | 

10. 4Z> 2 — Snb + 4 ; se presenta el mínimo cuando b = n 


10.18 Ejercicios (pág. 420) 

1- 9(x,y) =l(* 2 +y 2 ) + C 

2. 9(x,y) = x 3 y + C 

3. <p(x, y) = x 2 e y + xy — y 2 + C 

4. <p{x, y) = x sen + + + cos x + (x 2 + y 2 )l 2 + C 

5. <p(x,y) = x sen (xy) + C 

6. <p(x,y, z) = (x 2 + y 2 + z 2 )/2 + C 

7. <p(x, y, z) = x 2 /2 - y 2 l2 + xz - yz + C 

8. / no es un gradiente 

9. / no es un gradiente 

10. / no es un gradiente 

11. <p(x, y, z) = y 2 senx + xz 3 — 4y + 2z + C 

12. <p(x, y,z) = x + 2x 2 y - x?z 2 +2y - z 3 + C 

13. b) <p(x,y) = + Csi n * -1 ; <p(x,y) = a log r + C si n = -1 

15. <p(x) = ~~^2 + C si / * ~2 î ?>(*)= <ogr + Csip = -2 

16. <p(x)=g(r)+C 


10.20 Ejercicios (pág. 425) 

1. jc 2 /2 + 2xy +f!2 = C 

2. x 2 y = C 

3. x®/3 — xy - y/2 + (sen2j)/4 = C 

4. cos 2x sen 3 y = C 

5. x?y + 4x 2 y 2 - 12e* + 12 ye* = C 

6. J dx - ye IPM** = C 

8. a) x + y = Cy 2 

b) ftx? - 3 log |x| = C 

9. a) 6(xy)‘'* — (y/x)*? = C ; (x 3 y)~ 1 '* es un factor integrante 

b) x + e^sen y = C \ e~ x cos + es un factor integrante 

10. x 3 / + xy = C, 10xy + xy = C, respectivamente; xy es un 
común 


factor integrante 



11.9 Ejercicios (pág. 442) 

1- i 

2 . 1 

3. 2^/3 -V 

4. ,*/4 

5. 2 

6. 2n 

11.15 Ejercicios (pág. 453) 

1. —3n/2 5 „2 _ 

2. * + cos 1 + sen 1 - cos 2 - 2 sen 2 6. 6 

* ^ l t) I b) 2 ,) 320. 

9 - £ [íl f{x 'y )d y\ dx 

10 - £ dx 
“• /i [/*/(*. y)dx]dy 

n - /:t/ 2 _ ï Vl " ï /<*> y> dx i d y 

13 - L[S-v~f (x >y )dx ] d y + Slíw^f (x 'y> dx ] d y 

14- /o [/>> y> dx ] d y 

15 ' /-i íí-vï^f^' y> <**] d y + /: t/_ví>’ y> d *] dy 

16 ' /o [/»*/* f (x ’ y> dx ] d y 

"■ “y +£[CZT'/ter )*]“y 

18 ' /_2 [/1+4 f (x > yì d y] dx 
19 ' /:tr^ 2 +f )d y] d *=$ 

20. y = 0, y=xtgc, x 2 +y 2 =a 2 , x* + y* = b* 

21 ' a) Sì[Slu*f {x 'y )dx ] d y b ) 4e 8 + 2e/3 
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7. 6 

8. f-V - e*) + r-2 _ f-i 

10. i 

11. i(¥ - V2) 

12. ./2 

13. (log 2)/6 
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22. m = 2 ; n = 1 


11.18 Ejercicios (pág. 461) 

1. x=-i, ŷ =f 

2. * = 1, ŷ = 0 

3. ŷ = n 

4. x = tt/2, = 7t/8 

5. * - (V2 + 1)(^ -') + 

2a 2 log a - a 2 + 1 _ a(log a) 2 

6 ' X = 4(a log a - a + 1) ’ * = 2(a log a - a + 1) “ 

7. í =ŷ =i 

8. x => = 256/(3 15 tt) 

9. ¥ - ¥ Jog 3 

10. x = f ||+51|, ŷ = f ||+Z)|| ;suponiendo que los ejes x e y coincidan con los lados AB y , 
respectivamente 



12. 4 = 12b 3 (a - c), / v = A*(a 3 - c 3 ) 

13. 4 = / v = (1 - 57r/16)r 4 

14. 4 = 4=1 

15. 4 = nV[(4a - l)e ta - 1], 4 = âVtía 3 - 3a 2 + 6a - 6)<? 2 ° + 6] 

16. 4 = 4=W 

19. f/t[V2 + log (1 + y/2)] 

20. /t 2 + |r 2 

21. a) (¥, 1) 
b) (!,!) 

0 (¥,¥) 

d) (¥,¥) 

22. h = 2^3 

23. h > ry/2 


11.22 Ejercicios (pág. 471) 

1. a) -4 

b) 4 

c) 8 

d) 4 tt 

e) 3 tt/2 
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2 . 0 

3. n = 3 

4. -*■ 

9 - <?(*> y) = ±P 2 (*,^) + qv.j)]* 

* 11.25 Ejercicios (pág. 478) 

1. b) 0 

2. 0, 2 tt, -2n 

3. À lo sumo tres 

4. À lo sumo siete 

5. a) -3 

6 . 2ir 


11.28 Ejercicios (pág. 488) 

1 ' r [/> cos0 > r sen dr\ dd 

2> J_ i/2 [/ 0 f(r cos 6, r sen 0)r dr\ dO 
3 - r[/> cos 0, r sen 0)r dr\ dO 

4 ' r [r^ C0S 8 ’ r Sen 6)r dr \ d6, donde <? (Ô > = l/(cos 0 + sen 0) 

5 jr'* ® »ec * /(r cos $, r sen 0)r dr\ d $ + [jj* 0 9 f(r cos 0, r sen 0)r dr\ dO 

+ Lt 4 DT # “%« e.rsen 6)re/r] dO 

6. |ttû 4 

7. V[V2 + log (1 + ^2)] 

8. V 2 “ 1 

9. ™ 4 /8 

10 ' /o" rVí^os S, rsen0)rí/rj dO + £' 2 [/^‘/(rcos 0, r scnO)r dr~\dO 
U - r [/ 0 2 "*7(r)rrfr] dO 

1Z /o [/„(«) / (r 005 r sen 9 > <*] donde _§■(()) = l/( cos 0 + sen 0) 

13 ' /o ^ [CL </ (r cos 0 ’ r sen 0 > r ^] dO 

14. ^ 4 /3 

15. a) u =lx-y, v = -5x + y 
b) 60 
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a) 1+2« 

c) V 

2 1 1 5 \ 

d) 2 H-—I arctan — — — arctan —^ I 

V 3\ V3 y/3/ 

18. a) 4(« 2 + v 2 ) 
c) 0 

19. lip 2 + r 2 ) 1 -” - pW-»'] ûp*l; ir log (1 + r 2 ) sip = l. 
I(p, r) tiende a un límite finito cuando p > 1 


11.34 Ejercicios (pág. 504) 

+ 364 

2. l 0 gV2-A- 
3- -h 

4. jirabc 

5. w /6 

6 ' í: (/: [r/ ( . *+/: [r/c*. z > *) 

7 - /: r [,rs/ (x ’ * z> ❖] h * 

s - j: ir [j„v ( - j'* z) *+r /u=? *• z) *i * 

10. 16tt/3 

11. i 

12. -hna 2 h(}a 2 + 2A 2 ) 

13. |77û 3 

14. |tt( 6 3 - a 3 ) 

15. -*-7TR 3 (a 2 +b 2 + c 2 )-*+ 

18. §ir(5V'5-4) 

19. 52 

20. |tt(6 5 - a 5 ) 

22. En el eje , a una distancia % /i de la base 

23. En el eje , a una distancia % h de la base 

3 b* — o 4 

24. En el eje de simetría a una distancia - • del plano secante de los hemisferios 

25. x = ŷ = z = hh (suponiendo el vértice citado en el origen) 

26. àM(a 2 + 4h 2 ) 

27. | MR 2 

28. \Ma 2 

29. 2.W 
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12.4 Ejercicios (pág. 517) 

1. (a.,b 3 - a 3 b 2 )(x — x n ) + (a^ — a,b 3 )(y — y 0 ) + (a^ — a 2 bj)(z — z„) = 0 ; 

dr d r 

dïl * dv = - a A)» + (a ' tbl ~ ° lb 3V + («A _ a 2 b^)k 

dr dr 

2. x 2 jcr + y 2 jb 2 = z ; — x — = —2 bu 2 cos vi — 2au 2 sen vj + abuk 



4. z = f(Jx 2 + y 2 ); — *x ^ = -uf'(u) cos w' - «/'(«) sen v/ + uk 


, v 2 z 2 3r 3r 

5 - « 2+ r 2 = 1; â« x aŷ = 6 sen + a c°s vk 

6. (yjx 2 + j 2 - «) 2 + z 2 = b 2 ; 

dr dr 

— x — = b(a + b cos «)(cos « sen vi + cos « cos vj + sen «*) 

7. |aôc| cosh + ~£i~j cos h 2 v + se "^ P j 

8 . V 128 ” 2 +A _ 

9. |« - v\ ^/ 36u 2 v 2 + 9(« + v) 2 + 4 

10 . V « 4 + « 2 


12.6 Ejercicios (pág. 524) 

2. 77 a 2 v 3 

3. (2n - 4)a 2 

4. 4 

5. a) Un paraboloide de revolución 

b) —2 « 2 cos vi — 2 « 2 sen vj + «* 

c) « = 6 

6. V 2 ™ 2 / 4 

7. 277^6 

8. 2na 2 (3yj3 - l)/3 

9. 477 2 ró 

11. a) Un círculo unitario en el plano xy; un semicírculo unitario en el plano xz, con 
z < 0; un semicírculo unitario en el plano x = y con z < 0 
b) La semiesfera ac*+/*+z 2 = 1,z^0 
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c) La esfera x 2 + y 2 + z 2 = 1 excepto el Polo Norte; la línea que une el Polo 
Norte y (x, y, z) intercepta al plano xy en (u, v, 0) 

12.10 Ejercicios (pág. 532) 

1. 4tt/3 

3. x = ŷ = z = a/2 

4- i 

7. 0 

8. 77-^2 

9. En el eje del cono, a una distancia Ja(l 
esfera 

10. t ra 3 h + §77 at? 

11. 3na 3 h + \nah 2 


— cos a)/[l — cos (oc/2)J del centro de la 

12 . 2 77/3 

13. -77/3 


12.13 Ejercicios (pág. 539) 

1. 0 3. -4 

2 . -77 4 . 

12.15 Ejercicios (pág. 545) 

1. a) div F(x, y, z) =2x + 2y +2z; rot F(x,y, z) = 0 

b) div F(x, y,z)= 0 ; rot F(x, y, z) = 24 + 4j + 6 k 

c) div F(x, y, z) = — xsenj ; rot F(x, y, z) = i +j 

d) div F(x, y, z) = ye+ v - x sen (xy) - 2xz sen (xz 2 ); 
rot F(jc, y, z) = z 2 sen (xz 2 )j — [xe xv + y sen (xj)]At 

e) div F(x, y,z) =2x sen_y + 2 y sen (xz) — xy sen z cos (cos z); 

rot F(x, y, z) = [x sen (cos z) — xy 2 cos (xz)]i — y sen (cos z)j + [y 2 z cos ( xz)~ 
x 2 cos y]k 

2 . 0 

4. n = -3 

5. No hay tal campo vectorial 

10. Un tal campo es fi(x,y,z) = (xyzj~ 2 

11. div (V x r) = 0; rot (V x r) = (c + l)V 
13. 16(a + b) 


12.17 Ejercicios (pág. 551) 

1. (3x — 2z)j — xk es un tal campo 

2. (x 2 J2 - xy - yz + z 2 J2)j + (x 2 /2 - xz)k es un tal campo 

3. (x 2 y/2 + z 2 /2)j + Vf(x, y) para cualquier f independiente de z 

5. G(x, y, z) = - / Z r i - . f* satisface rot G = r~ 3 r para todos los puntoi 
J r(x 2 +y 2 ) r(x 2 + y 2 ) 
que no estén en el eje z 
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6. f(r) = Cr~ 3 

9. F(x, y, z) = -\(z 3 i + fj + fk), G(x, y, z) = + fz + z 3 x) 

10. c) 3n/2 

12.21 Ejercicios (pág. 563) 


3 

3. a) 

3 \ V\ 

a) 14477 

b) 

9\V\z 

b) 1677 

c) 

W\x 

c) 12877 

d) 

4 l z 


15. 8 tt 

Capítulo 13 

13.4 Ejercicios (pág. 575) 

2. (A k nA’ 2 n A£) u (A 2 nA£uA s ; \J A k = ’\J (A k n f) A' } ) v A n 

*-1 *-i í-*+i 



(0 

(ii) 

(iii) 

(iv) 

(v) 

(a) 

A' n B' 

\ A nB' 

A B 

(A n B') u (A' n B) 

A' uj?' 

(b) 

500 

200 

500 

300 | 

800 


6. = {0, A lt A t , A k v A t , A[, A’ z , A[ n A' t , S} 

1. = {0, A lt A 2 , A a , A^ <u A t , A 2 v A a , A^ v A 3 , A x V A 2 u A a , A’, A 2 , A' 3 , A[ n A' 2 , 

A 2 n A' a , A' 2 n A 3 , A' t n A' 2 n A' a , 5} (si« > 3) 


13.7 Ejercicios (pág. 581) 

1. A £ B' 

2. xeA'nB'nC' 

3. xeAnB'nC' 

4. xeA v B v C 

5. xe(A nB' n C') u (A’ n B n C’) u (A' n B’ n C) 

6. xe (A' n B') u (B' n C') u (A' n C') 

7. X e (A n B) u (A n C) u (B n C) 

8 x e (A n B n C') u (A n B' n C) u (A' n B n C) 

9 x e (A n B n C)' 

10. xeAnCnB' 

11. xeAnBnC 

12. xeA u B u C 
15. a) 1 - a 

b) 1 -b 

c) a + b - c 


d) 1 - c 

e) 1 - a + c 

f) a-c 
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13.9 Ejercicios (pág. 584) 


d) |f 8. a) AI(A + B) 

3. a) || b) BI(A + B) 

b) | c) (C + 1 )/(C + D + 1) 

c) | d) Cj(C + D + 1) 

d) * 9. a) | 

e) || b) | 

0 1 c) f 

4. i d) | 

10. P 0 = 1 - P(A) - P(B) + P(A n B), P a = P(A) + P(B) - 2P(A n B), P 2 = P(A < 
12. a) 5 a 9 


b) 45 a 46 

c) 10 a 81 

d) 36 a 55 

13.11 Ejercicios (pág. 591) 


1. {(1, 2), (1,3), (2,1), (2, 3), (3, 1), (3, 2)} 

2. 1326 

3. 54 

4. {H, T } x {H, T} x {1, 2, 3,4, 5, 6} ; 24 resultados 

5. 52!/(13!) 4 


a) 13 ■ 12 • 11 • 72 = 123552 (no incluyendo ti 

b) 5148 

c) 36 (no incluyendo \0JQKA) 

d) 4 


11. 16 
12. n k 
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13.14 Ejercicios (pág. 597) 

2. a) P(A) = * ; p(B\A)=ft; P(A n B) = ■& 



5 - A 


6. a) 


26! • 34! 
21! * 39! 





9- i 

15. a) P(A) =P(B)= P(Q = \ ; P(A n B) = P(A 
P(A n B n Q = 0 


C) 


P(BnC)=\; 


13.18 Ejercicios (pág. 608) 


2 . 


a) P(H, H) = PlPì ; P(H, T) = Pl (l - Pì ); 
P(T, T) = (1 - Pl )(í - Pi ) 

b) Si 

c) No 

d) H x y . H it H x y T 2 , H t y T lt T^ y 

a) fif 

b) 1024 

c) 6 


P(T, H) = (1 - Pl ) Pi ; 

T t 


/1°\ £_ 390625 

\ 3 / 6 10 ~ 2519424 


4- a) * 

b) i 

c ) A 

5. a) (5!) 2 /10! = ^ 

b) i 

6. a) 36 P 10 — 80 P 9 + 45p 8 

b) -rh 

7. Es ventajoso apostar cantidades iguales de dinero 


/tt\ 

' \k)(w + b) n 

/8\17 5 9938999 

9 ' \3/Ï8 1 “ 1377495072 

10. fff 

11. 1 - (19/20) 10 = 0,4013 

12. iff 

14. 59 < n <, 65 
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15. a) f(p) = (\- p f 

+ P 3 

b) (v 31 — 4)/3 

13.20 Ejercicios (pág. 614) 

1. a) f(k) = 2k 
b) f(k) = 3 k 

c) f(k) = Pìc, donde 

Pk es el fc-ésimo primo >2 

d) una tal función e 

f(k) = (g(k), h(k)), donde 

g(k) — 

m\k) + 3m(k) m\k)+m(k) 

2 k +2, h(k) — k ---, 

mayor entero <,x 

y 

donde [jc] representa el 

e) f(k)=2’W3 h W, 

donde g (k) y h(k) son las definidas en (d) 

13.22 Ejercicios (pág. 617) 

1. n = 0 : máx = 1, 

mín = \ 

n = 1 : máx = £, 

mín = 0 

n = 2: máx. = i. 

mín = 0 

n = 3 : máx = yç, 

mín = 0 

3. a) 1 - qp* - ptf 

4. a) 3 pql(pq + 2) 

b) g 

b) i 

c) f 

c) 2 log 2 - 1 

13.23 Ejercicios variados sobre probabilidades (pág. 618) 

1. tV 

8. a) f 

2. a) h 

b) f 

b) h 

c) f 

3. a) £ 

d) No 

b) 

4. a) 
b) 

9 . pb + ep^fj 

0 fh 

10. np( 1 — p) n ~ l + np n ~ x (\ - p) 

5- ff 

.1 n /, n r - 1 

7. 0.65 

2 n_1 \ 2 n_1 / 


Capítulo 14 

14.4 Ejercicios (pág. 625) 

1. b) X<,b 
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2. a) {co | X(co) e (a, b], Y(w) e (c, d]} 

c) X<,a, Y <, d 

d) P(a < X <, b, c < Y <, d) — P(X <, b, Y <, d) - P(X <, a, Y <, d) - P(X<, b, Y <, c) 
+ P(X<,a,Y<, c) 

3. a) {(1,6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}, {(5, 6), (6, 5)}, {(1, 6), (2, 5), (3, 4), (4, 3), 
5, 2), (6, 1), (5, 6), (6, 5)} 

b) P(X = 1)=\-, P(X = 11) P(X = loX = U)=% 

4. Y = X x + X 2 + X 3 + X t ; P(Y = 0) = *; P(Y = 1) = \ ; P(Y <, 1) = * 

5. Y = IX si 0 < X <, 100; Y = 10JT - 300 si X > 100 

6. a) Z = Y - 1 

b) U = Y^+ Y 2 - 1 


14.8 Ejercicios (pág. 637) 

2- t I 2 3 4 5 6 7 8 9 10 11 12 


Px(t) iTeTTTTT 3T T Tê ï À TT TS 

3. b) p(-2) = i, p(0)=p(2)=ì 

C) 

5. a) c = J 

b) iiif 

c) í'í?) = Oparaí < 0, F(t) = iparaO <, t < 1, F(t) = £paral <, t <2, F(t) = lpara 
tï2 

d) No hay tal t 

e) t = 2 

6 - a > k I 0 1 2 3 4 


p(k) | if tî h th èi p(t) =0 para t * 0, 1,2, 3, 4 

b) F(t) = Opara t < 0, F(t) = if en [0, 1), F(t) = if en [1, 2), F(t) = t eni [2,3), 
F(t) = tf en [3, 4), F(t) = lparaí > 4 
C) 2-7,81 

7. b) P(X = 0) = (1 - /7) 2 ; P(X = 1) = 2/7(1 - p) 

8 - Px(k) = n ^ n + j) ; 7^(r) - ^ yy ^ para 0 < t <, n, donde [(] es el mayor entero 

<,t; F x (t) = Oparaf < 0; F x (t) = lpara t > n 
9. p(k)=e~°^; k =0,1, 2,3,... ; c>0 
p(t) = Oparaí ^ 0, 1, 2, 3,. . . 

10. a) p x (t) = i en í = — 1 y / = +1 ; p x (t) = 0 para los demás valores 

F x (t) = Opara t < —1 ; F x (t) - |para—1 < / < 1 ; F x (t) - lpara/ > 1 
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11. P(A) = } ; P(B)= f; P(A^B) = \; P(B\A )=*; P(A KJ B) = 1 


14.12 Ejercicios (pág. 647) 

1. a) c == 1 ; f(t) = 1 si 0 < / < 1; f(t) = 0 para los demás valores de t. 

b) 0, } 

2- c=\\ F(t) = 0sit < -»/2; F(r) = \ cos r si- ff /2 £ t < 0 -,F(t) = 1 - £ cos t 
si 0 < / < tt/2 ; F(l) = 1 si t > „/2 

3. c=f; F(/) = 0 si í < 0; F(/) = i(3/ 2 - /») siO <; t £ 2; F(r) - 1 si t >2 

4. a) \ 

b) è 

c) i 

5< a) = S si - ?l ; f r</ )“ 8/ - lsii ^ ? / (í) = ? - 8 '«i^i<î; 

b) F(r) = 0 si / < \; F(0 ■ 4/ 8 - / sij <, t < |; F(/) = -4/ 2 + 7/ - 2 si 
i ^ t < î: F(/) = 1 si / £ | 

0 1,1,*,0,À 

6. a) 

b) / = 1 

7 - a) k I 5 10 15 20 25 30 

p{x*k) |~t § í i ï r 

b) Cada tren Styx llega 5 minutos antes que un tren Lethe 
9 F ^f 0SÌt <b '’ F r( , '> = (‘- b )l asib ít £b+a; F r (t) = 1 si / > b + a 
b) || 

O ff 

. 1 1 / — b 

10. F(/) = - + - arctan- 

14.16 Ejercicios (pág. 657) 

1. a) 105 

b) 10.05 

2. a) KV2 - 1) 

b) i(2 -V?) 

c) i(2 — ỳ/2) 

d) A(4 - ,/2) 

3. a) 1 - e- 1 

b) e~ 2 

c) (e — l)/e 2 

d) e -3 

4. F(/) = 0 si / < c; F(/) = 1 - e-Ut-c) s i / ^ c 
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6. A' = A/a, c' = b + ac 

9. a) 0,5000 

b) 0,1359 

c) 0,9974 

d) 0,0456 

10. a) 0,675 

b) 0,025 

11. a) 0,675<r 

b) 0,025tr 


12. a) 0,8185 
b) 0,8400 

13. 75,98 pulgadas 

14. media = 6 , varianza=a 2 

15. F r (t) = Osi t < 0; f r (t) = 0 si / £ 0; f T (t) = <r m ly/2nt sií > 0 
14.18 Ejercicios (pág. 660) 

1. a) Fy(í) = 0 si/ < 1; F r (/) = (/-l)/3sil £/£4; F f (í) = 1 si/ > 4; 

f Y (t) = J si 1 <, t ^ 4 ; fy(t) = 0 para los demás valores de / 

b) F r (/) = 0si/< -2; F r (t) = (/ + 2)/3 si -2 < / < 1; F y (/) = 1 si/> 1 ; 

/ y (/) = J si —2 ^ / ^ 1 ; /V(/) = 0 P ara l°s demás valores de / 

c) Fy(/) = 0 si / < 0; Fy(t) = t' /í s\ 0 <, t < 1 ; F r (/) = 1 si / > 1 ; 

fy(t) = (2/)-!* si 0 <, t <, 1 ; fr(t) - o para los demás valores de / 

d) Fy(t) = c‘ si/ £0; F y (/) = 1 si/ >0;/ r (/)=^si/ £0; f Y (t) =0 si/ >0 

e) F y (t) = e t/2 si/ <£0;F r (/)=lsi/ >0;/ F (/) = ie‘ /2 si/ ^ 0 ;/ F (/) = 0 si / > 0 

f) Fy(t) = 0 si / < 1 ;F r (/)=log/ si 1 ^ / <.e;F r (t)= 1 si / >e;f Y (t) = 1// si 
1 < / e ; fy(t) = 0 para los demás valores de / 

2. Sea la función inversa de <p definida en intervalo abierto (a, b) 

Entonces F r (t) = 0 si / < a ; F r (t) = F A .[y(/)] sia < / < b ; F r (/) = 1 si / > 6 ; 
fy(t)= f x (v>(tW(t) si a < t < b ; fy(t) = 0 para los demás valores de / 

3. a) / F (/) = 0 si / < 0 ; f r (t) = (2*1)-'^'* si / > 0 

b) f y (t) = 0 si / < 0; /y(/) = 4/(2 ^)-^c-‘ 4/2 sì / > 0 

c) / F (/) = 0 si / < 0 ; f Y (t) = (2 w / 2 r^e- ,logí)2/2 si/ > 0 

d) / F (/) = (^Tr)- 1 ^ sec 2 / e“ Uan2 ‘ ,/2 si |/| < n/2 ; f Y (t) = 0 si |/| > nj2 

14.22 Ejercicios (pág. 666) 

2. a) P(X = x t ) =P(X = x 2 ) =P(Y= yi ) =P(Y = y 2 ) = i(p + q) 
b) p =q = i 

3. ») ï OLyid, 

F(x,y) = * _ ° a sia <, x <, be y > d, F(x,y) _ - six>byc<y<d. 
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Soluciones a los ejercicios 


F(x,ý) ■= 1 si jc > e y > d, F(x,y ) = 0 para los demás valores de x e y 

b) F x (x) = (x-a)/(b — a) si a < x < b ;F x (x)=0 s\ x< a' F x (x)=\ si x <b; 
F Y (ý> = (y - c)l(d - c) sic <y < d;F r (y) = Osi y <c;F Y (ý)= 1 si y < d 

c) X e Y son independientes 

5. P(r = 0)=i; P(Y = 1) =P(Y = 2) =| 

7. 

8. £ 

9. b) f(x,ý) =isi(x,ý)eQ; f(x,y) = 0 si (x,y) $ Q ; 
f x (x) =1 - \x\ si \x\ <, 1; f x (x) = 0 si |*| > 1 ; 

f Y (y) = 1-1^1 si \y\ < 1 ; f Y (y) = 0 si \y\ > 1 . 

■X e Y no son independientes 
10. g(u, v) =f(u+a,v+ b) 

14.24 Ejercicios (pág. 673) 

1. b) fy(v) = 1 + p si —1 £v <0; fv(v) = 1 - v siO £ v <, 1 ; f v (v) = 0 si |y| >1 
c) U y V no son independientes 

2i b) fy(t) = 2 — 2/siO^í^l; fy(t) = 0 para los demás valores de t 
c) U y V son independientes 

3. b) g(u, v) = ue~ u si u > 0,0<tKl ; g(u, v) = 0 para los demás valores de u y v 

c) f v (u) = ue~ u si u > 0; f v (u) = 0 si u <, 0 

d) f v (v) = lsi0<e<l; fy(v) = 0 'Para los demás valores de v 

4. b) g(u, v) = (vl27r)e~\ l + u,)u,/î si v £ 0 
c) f v (u) = [^(1 + tt 2 )r x 

5. fzO) = 

6. b) f v (u) = 0 si u < 0; f v (u) = (u/a 2 ) exp ^ si u > 0 ; F v (t) = 0 si t < 0 ; 

F v (t) = 1 - exp ^ si t £ 0 

14.27 Ejercicios (pág. 681) 

1. E(X) = 1, Var (X) = ^ 

7. a) E(X) = Var (X) = 2 

b) No 

c) E(X) = 1/2, Var (20 = 1/2 2 

d) E(X) = m, Var (X) = a 2 

8. a) C(r) =(r- l)/2 

b) Fx(t) = i |í| 1 - r si t < -1; F x (t) = i si -1 < t<, 1 ;F x (t) = 1 - iF~ r si t> 1 

c) P(X < 5) = 1 — 5 r - 1 l2 ; P(5 < X < 10) = (5 x - r - I0 1 ~ r )l2 

d) X tiene esperanza finita cuando r > 2; E(X) = 0 

e) Varianza finita para r > 3 ; Var (X) = (r — 1 )/(r — 3) 

9. E(X) = E(Y)= ; E(Z) = -1767/50653 ; E(X + Y + Z) = -4505/50653 

10. E(X) ->■ oo cuando n -*■ ao 

12. a) (2/n)* 

b) e'X 



c) e 2 — e 

d) Gr/2)* 
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14.31 Ejercicios (pág. 691) 

4. 251 

5. 0 

6. La desigualdad de Chebyshev da %; las tablas dan 0,0027 

8. b) 0,6826 

9. b) 0,0796 

10. a) 0,0090 

b) 0,0179 


15.5 Ejercicios (pág. 703) 
2. a) No 

b) Sí 

c) Sí 

d) No 

e) Sí 

f) No 

g) Sí 


Capítulo 15 

3. a) Ni lo uno ni lo otro 

b) Seminorma 

c) Seminorma 

d) Ni lo uno ni lo otro 

e) Seminorma 

f) Norma 

g) Ni lo uno ni lo otro 

h) Ni lo uno ni lo otro 


6. a), b), c) 

8. b) E1 polinomio de a) más f (5*® — 3x) Jlj (5f * — 3 t)f(t) dt + -^-§^(35^ — 3Cbc 2 + 3 

x íii (35/ 4 - 30í 2 + 3)f{t)dt 

9. a= —3ej4 + 33/(4e), b = 3je, c = x He - 7/«) 

10. h\(\ + 14x 2 - 7x*) 

11. b) ||/-P|| 2 = & 

n - 1 loe 2 n 

12. a) || P -/|| 2 = — - 


- Vo. - 1 )« («-d* , us 7 

IIP -/II 2 = 36 log 2 - 28 log 2 2 - * 


4(n 3 — l)log» 6(« + 1) 
f (« - 1 f (« - l) 2 ; 
= 0,0007 cuando « = 2 


13 a) ||J» -/|| 2 = -[(«- 2)e 2 ” + 4e n - « - 2] 


b) P(x) = (18 - 6e)x +4e - 10; ||P —/|| 2 = 20e - | 


,, ^ N V(2A + 1)(2* + 3) , x k l2k+3 _ , , 

14. b) <p k+l {x) =-- x <PÂx) - k + x J Yk- 1 > donds ^ = 
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Soluciones a los ejercicios 
[P m (x)P' m+l {x) - P m+1 (x)P' m {x)] 


15. b) S PUx) = 

Pm+1 


15.9 Ejercicios (pág. 713) 

1. a) P(x) = ±(x 2 + 13x + 12) 

b) P(x) = i(x 2 - 5x +6) 

c) P(x) = -ì(jc 3 - 6jc 2 + 5x - 6) 

d) P(x) = 2x 2 + x 2 - x - 2 

e) P(x) = — 5jc 3 — jc 2 + 10jc — 5 

2. P(x) = ârô(9jc 4 - 196 jc 2 + 640) 

4. a) Q(jc) = 2JC 3 + 3jc 2 - jc - 3 
b) <2 (jc) = 4jc 3 + 7jc 2 - 3jc - 7 

5. a) P(32)=|4; /(32) - i»(32) = 

b) P( 32) =H!; /(32) -P( 32) = 

c) />(32) = !§ ; /(32) - /(32) = 

d) P( 32) = ; /(32) - /(32) = 

7. a) Z. 0 (jc) = /*(« - 1)(« - 3)(« - 4)(« - 6); Z^(jc) = -£«(« - 3)(« - 4)(« - 6); 

L ì(x) = A“(“ - !)(“ - 4 )(“ - 6 ); £»(*) = - À“(“ “ !)(“ - 3)(« - 6); 

L t (x) = t!o“(“ - D(« - 3)(« - 4) 

b) /(2.6) = 20 

8. b) jc £ 1,581 

c ) h <, 0,0006 

12. a) « = 0, b = l 

b) c = 1, d = -2L' k (x k ) 

13. d) Sean B 0 (x) = 1 y B n (x) = (x — x 0 )(x — x 0 — nh) n ~ 1 jn ! para n ^ 1 ;el único poli- 

nomio P de grado < n que satisface las condiciones P(x 0 ) = c 0 , /'(jc x ) = c x , 
P"(x 2 ) = c 2 ,.. . , P (n) (x„) = c„ viene dado por /(jc) = c 0 B 0 (x) + • • • + c„B„(x) 


15.13 Ejercicios (pág. 721) 

4. b) 8 -5040 13068 -13132 6769 -1960 322 -28 1 

9 40320 -109584 118124 -67284 22449 -4536 546 -36 1 

10 -3628800 1026576 -1172700 72368o|-269325 63273 -9450 870 -45 1 

c) 1 + 2jc + 2jc 2 - 3JC 3 + jc 4 

5. c) 8 1 127 966 1701 1050 266 28 1 

9 1 255 3025 7770 6951 2646 462 36 1 

10 1 511 9330 34105 42525 22827 5880 750 45 1 



Soluciones a los ejercicios 803 

d) -1 + óx* 1 » + 16 jc< 2) + 9jc< 3 > + jc< 4 > 

7. a) + « 3 + -~n 2 + - 8 J-« 
b) i« 4 + |« 3 + |« 2 + ì« 

0 i« 4 +4«3 + “« 2 + 3 « 
d ) T " 5 + i ” 4 + i « 3 - TÔ« 

15.18 Ejercicios (pág. 750) 

2. b) 7;(1) = « 2 , r^(-i) = (-ìr-v 

5. sen 0 sen «0 = -— T„(x) ; grado = « + 1 

7. Q(x) = Jc n+1 - 2“ n r n+1 (jc) 

8. GW = -fjc 4 + ifx 3 - Ifjc 2 + fâx - gi 2 

14. b) U 0 (x) = 1, U t (x) = 2 x, U 2 (x) = 4x 2 - 1, (/ 3 (jc) = 8JC 3 - 4jc, 

£/ 4 W = Iój: 4 - 12jc 2 + 1, U h (x) = 32jc 5 - 32jc 3 + 6jc 


15.21 Ejercicios (pág. 742) 


2 . 


3. 


a) 

b) 

a) 

b) 

a) 

b) 


0.693773 - £ , donde 0,000208 ^ e £ 0,001667. 
desigualdades 0,6921 < log 2 < 0,6936 


= V3/3 


De esto resultan las 



a+b b-aj 3 

2 2 3 




a+bb-aj2 
2 + 2 2 ’ Ci! 


a +6 b - a yfl 
2 2 2 


4. a = 2 + ^2, 6=2 — ^/2 

5. c = V| 



10. a) log 2 = 0,693254 - c, donde 0,000016 < c < 0,000521 ; esto nos da las 

desigualdades 0,69273 <log2 < 0,69324 
b) log 2 = 0,69315023 - c, donde 0,00000041 < c < 0,00001334; esto nos 
conduce a las desigualdades 0,693136 <log2 < 0,693149 

11. d) log 2 = 0,693750 - c, donde 0,000115 < c < 0,003704; esto nos conduce a las 

desigualdades 0,69004 < log 2 < 0,69364 
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